ID товара: | 105576664 |
sarakit Эта малиновая плитка по расширению. Он оснащен 3 микрофонами с функцией расположения звука и стереопроизводством для реализации проектов, связанных с искусственным интеллектом и голосом. Два независимых драйвера BDC позволяют тихое и точное управление двигателем при разработке устройств. Он оснащен интерфейсом CSI с двумя камерами и двумя ускорениями, гироскопом и датчиком температуры.
Создайте современные, эффективные и гибкие голосовые продукты, используя Raspberry Pi, интегрированный с Amazon Alexa, Google Assistant, CHATGPT и многим другим.
Создать роботы голоса -control. Общайтесь с домашними приборами, офисом или другими вещами в повседневной жизни, все в голосе.
sarakit set состоит из трех элементов:
Осторожно установите гибкий провод, вставив его в материнскую плату J1 Sarakit и разъем J1 Adapter камеры.
J2 и J3 соединения являются стандартными соединениями CSI. Вы можете подключить камеры, совместимые с Raspberry Pi.
Sarakit оснащено тремя микрофонами и специализированным аудиопроцессором, который очищает голос и поддерживает распознавание языка, Raspberry Pi, предлагая значительный шаг в заговоре голосовой команды в вне -областях. В то время как многие инструменты распознавания языка доступны в Интернете, а инструменты анализа данных, основанные на облаке, такие как Google Sheam to Text, являются одним из лучших и наиболее эффективных, как обсуждалось в моей следующей статье, в этой статье, которая была сосредоточена на не -log -in -loneling -без подключения к Интернету.
При поиске лучшего и простейшего инструмента конфигурации я столкнулся
Инструменты распознавания языка VAPK
Vosk - это набор инструментов распознавания с открытым исходным кодом в автономном режиме, облегчая распознавание языка более 20 языков и диалектов, включая английский, немецкий, французский, испанский и многие другие. Его модели компактны (около 50 МБ), но поддерживают постоянную транскрипцию большого словаря из -за потокового API, они сразу же предлагают реакцию, они предлагают переработанный словарный запас и идентифицируют динамики. Vosk поддерживает множество приложений, начиная с чат -ботов и интеллектуальных домашних приборов с виртуальными помощниками и проектирующими заметками, от небольших устройств, таких как Raspberry Pi или смартфон, с Android до больших кластеров.
Main Vosko: & nbsp; https: //alhacephei.com/vosk/
github vsk: & nbsp; https: //github.com/palhacep/vosk-api
установка саракита:
Предполагая, что основные драйверы саракита уже установлены & nbsp; https: //sarakit.saraai.com/getting-started/software эн
Чтобы использовать другой язык, чем на английском, загрузите требуемую языковую модель с веб -сайта & nbsp; https: //palhacephei.com/vosk/models и поместите его в каталог "модели".
Начало распознавание языка путем запуска:
python speechocognition.py
Ниже приведен сценарий распознавания языка, который вы выбираете, который можно найти
https://github.com/saraye/sarakit-peech-ecognition-vosk-vosk-vosk-pi .:
Может случиться так, что вы используете полную мощность Raspberry Pi, например, изображения, и тогда может оказаться, что вам не хватает мощности расчета для распознавания языка. В таких случаях вам нужно будет использовать анализ в облаке на более сильном компьютере. Вы можете настроить свой сервер и продолжить использование VOSK или вы можете выбрать другие инструменты, такие как Google Text.
Текст языкаsarakit с тремя микрофонами и специализированным аудиопроцессором, который очищает голосовой звук и поддерживает распознавание языка Raspberry Pi с расстояния до 5 метров, как описано в нашем распознавании языка. Однако, чтобы завершить конфигурацию, мы теперь обращаем внимание на обработку языкового текста (TTS), что может быть особенно полезно для создания голосовых помощников, выступления на устройствах или интеграции с системами автоматизации дома (HA). Хотя лучшими доступными системами TTS являются онлайн -сервисы, такие как Eleven (Payable), которые предлагают высочайшее качество голоса или текст Google для языка (детали в отдельном разделе), здесь мы сосредоточены на обработке текста на языке.
При поиске Интернета в поисках лучшего, быстрого и простого варианта -насталли, Piper выделяется как лучший выбор (если вы найдете что -то лучше, дайте нам знать).
Piper быстро, создает высококачественный голос в режиме реального времени и оптимизируется Raspberry Pi 4. Хотя его установка проста, я также упростил его для вас, и демонстрацию с описанием можно найти ниже.
Вы можете попробовать Piper:
https://rhassy.github.io/piper-samples/
piper на Githuba:
https://github.com/rhassy/piper
https://github.com/rhassy/piper-phonemize (дополнительная компонент)
Голоса для Piper:
https://huggingface.co/rhassy/piper-voices/tree/main
GitHub:
https://github.com/saraye (C ++, примеры Python)
youtube sarakit playlist:
https://www.youtube.com/playlist?
ID товара: | 105576664 |
Категория: | Аксессуары для компонентов |
Количество упаковок товара: | 1 шт. |
Размеры и вес упаковки (1): | 0,5 x 0,5 x 0,5 м, 0,5 кг |
Торговая марка: | Raspberry |
Все товары этого бренда: | Все товары Raspberry |
Изображения продуктов приведены исключительно в иллюстративных целях и являются примерными. Ссылки на видео в описании товара предназначены только для информационных целей, поэтому информация, которую они содержат, может отличаться от самого товара. Цвета, надписи, параметры, размеры, функции и/или любые другие характеристики оригинальных продуктов из-за их визуальных характеристик могут отличаться от реальных, поэтому, пожалуйста, ознакомьтесь со спецификациями продукта, приведенными в описании продукта.
*Для предложений конкретного продавца действуют только те условия, которые указаны возле продаваемого им товара, и за всю информацию в них (включая цены) ответственен конкретный продавец.