dzz: Dizzy の冬 (Default)
Вокруг 2025 год, парад нейросетей с LLM и распознаванием речи, но я до сих пор не вижу:

1. Опенсорсного голосового помощника для Linux, способного работать локально, т.е. без подключения к интернету, но с качественным распознаванием речи и приятным уху TTS, пусть и на хорошей видеокарте.

2. Персонализируемого голосового помощника под Android (чтобы можно было менять обращение и голос) c локальным распознаванием и генерацией речи. Или без локального, но, хотя бы, с минимальной кастомизацией из скобок.

3. Какого-либо вменяемого протокола для обмена голосовыми командами в виде RFC.

Всё, что нашёл - либо насмерть сетевые Окей-Гугл/Алиса/Маруся, либо "вот тебе, батенька, ведро с гайками и баллон кислорода, можешь собрать из них космический корабль". На сборку космического корабля с нуля нет ни времени, ни сил, но есть идеи, как это привязать к управлению разными штуками на верхнем уровне.

Соответственно, вопрос - что я проглядел в текущем технологическом стеке? Может, зря ною, и такое уже есть?

No-more-Alice.png
dzz: Dizzy の冬 (Default)
Zoom_Meetings.png

Мы, кстати, много использовали на работе Zoom, но в конце года переползли в Discord, где качество кодеков существенно лучше.

December 2025

S M T W T F S
  12 3456
7 8 9 10 11 1213
14151617181920
21222324252627
28 29 3031   

Syndicate

RSS Atom

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 31st, 2025 01:32 pm
Powered by Dreamwidth Studios