Снова хочется странного
Jul. 30th, 2025 04:41 pmВокруг 2025 год, парад нейросетей с LLM и распознаванием речи, но я до сих пор не вижу:
1. Опенсорсного голосового помощника для Linux, способного работать локально, т.е. без подключения к интернету, но с качественным распознаванием речи и приятным уху TTS, пусть и на хорошей видеокарте.
2. Персонализируемого голосового помощника под Android (чтобы можно было менять обращение и голос) c локальным распознаванием и генерацией речи. Или без локального, но, хотя бы, с минимальной кастомизацией из скобок.
3. Какого-либо вменяемого протокола для обмена голосовыми командами в виде RFC.
Всё, что нашёл - либо насмерть сетевые Окей-Гугл/Алиса/Маруся, либо "вот тебе, батенька, ведро с гайками и баллон кислорода, можешь собрать из них космический корабль". На сборку космического корабля с нуля нет ни времени, ни сил, но есть идеи, как это привязать к управлению разными штуками на верхнем уровне.
Соответственно, вопрос - что я проглядел в текущем технологическом стеке? Может, зря ною, и такое уже есть?

1. Опенсорсного голосового помощника для Linux, способного работать локально, т.е. без подключения к интернету, но с качественным распознаванием речи и приятным уху TTS, пусть и на хорошей видеокарте.
2. Персонализируемого голосового помощника под Android (чтобы можно было менять обращение и голос) c локальным распознаванием и генерацией речи. Или без локального, но, хотя бы, с минимальной кастомизацией из скобок.
3. Какого-либо вменяемого протокола для обмена голосовыми командами в виде RFC.
Всё, что нашёл - либо насмерть сетевые Окей-Гугл/Алиса/Маруся, либо "вот тебе, батенька, ведро с гайками и баллон кислорода, можешь собрать из них космический корабль". На сборку космического корабля с нуля нет ни времени, ни сил, но есть идеи, как это привязать к управлению разными штуками на верхнем уровне.
Соответственно, вопрос - что я проглядел в текущем технологическом стеке? Может, зря ною, и такое уже есть?

Навеяло посещением ресторана Il Patio :)
Date: 2025-07-31 09:11 am (UTC)> гораздо больше места, чем в смартфоне
Место в шлеме в большей степени предназначено для демпфирования удара по голове, там не должно быть жёстких конструкций с углами. Ну, т.е. в природе существуют шлемы со встроенными с завода гарнитурами и AR-дисплеями, но стоят они как самолёт и продаются в количестве N штук в год.
> которые не оправдались
Это, кстати, тоже удивляет. После того, как гугл свернул Google Glass, всё, что осталось на рынке AR, ушло в область профессионального применения и профессиональных же цен. В т.ч. и по компонентам: микродисплей с призмой и SPI-контроллером стоит на алике порядка 30 т.р., готовое устройство на один глаз будет стоить на полке минимум вдвое дороже.
Думается, это основной сдерживающий фактор. Были бы массовые AR-очки за $100, надежды бы оправдались. Но имеем что имеем.
Re: Навеяло посещением ресторана Il Patio :)
Date: 2025-07-31 09:15 am (UTC)> Там не должно быть жёстких конструкций с углами.
Надо собирать микрокомпьютер на овальной плате. Но многослойные печатные платы, которые сейчас для этого используются — не для домашнего хоббиистского изготовления.
no subject
Date: 2025-07-31 09:22 am (UTC)Хоббиты заказывают прототипные платы в каком-нибудь Резоните, сделать партию из 10 штук — исключительно вопрос цены, и это не запредельно. AR-дисплей всё равно дороже.
P.S. Грёбаный "новый редактор комментариев", сорри за многочисленные правки.