![]() |
С удовольствием потестирую программу :)
|
как-только внедрю системный блок, тоже захочу привязать данную программку к своей лошади!
|
Все на готове...ждемс.
|
Я тоже встану в очередь
|
google speech api (https://www.google.com/speech-api/...) ?
|
Для гугловской рапознавалки интернет нужен
|
почитал первую страницу. там говррится про Microsoft Speech API. Но он не имеет распознования на русском. Только синтезатор есть русского языка. Его слышно в демонстрации. Это мужской цифровой голос.
по распознованию знаю не по наслышке. В прошлом году готовил доклад и сравнивал гугл и мс. |
Проба пера
Спасибо всем, кто откликнулся и изъявил желание протестировать мою софтину! Выкладываю.
Только я почти уверен, что с первого раза система мало у кого заведется, т.к. компонентов в ней получилось немало, а протестировать её на чем-либо кроме парочки своих ноутбуков я не могу... (собственно, ради этого я сейчас и выкладываю). Системные требования 1. OS Windows 7 home premium и выше. (Будет ли работать на Home basic и xp, надо проверять). 2. Веб-камера со встроенным микрофоном. Программа заработает и на обычном микрофоне, но распознаваться почти ничего не будет. На данный момент лучше всего работают камеры InPerson HD. 3. Установленный .NET 4.5. Скачать можно тут. Инструкция по установке: 1. Качаем архив со всем необходимым, распаковываем. 2. Устанавливаем speech_platform_sdk.msi. 3. Устанавливаем ms_recognition.msi. 4. Устанавливаем RHVoice-v0.2.161-setup.exe 5. Распаковываем recognizer.zip в любое место. 6. Идем в настройки записи звука ОС и делаем микрофон камеры устройством записи по-умолчанию (правой кнопкой). В настройках камеры выставляем средний уровень записи и отключаем усиление (далее этими показателями можно поиграть для лучшего распознавания). 7. У хороших камер часто можно включить дополнительную обработку звука, которая находится на закладке "дополнительное". Если есть - отлично! Включаем! 8. Запускаем KinectMicrophone.exe, жмем activate. 9. Сказать голосом "что за регион NN" (цифры отдельно, например что за регион один-семь-семь, а не сто-семьдесят-семь) и в идеале услышать ответ. Процесс распознавания будет отражаться на экране. Цифры в скобочках означают достоверность распознавания. Система срабатывает на фразы с достоверностью >= 0.85, причем всякий мусор с достоверностью <0.5 она будет слышать всегда, даже в тишине. На него надо просто не обращать внимания (программа так и делает). В машине У меня лучше всего получалось распознавание, когда я взял камеру inPersonHD и закрепил её на водительском козырьке. При этом я включил у неё опцию формирования луча направленности (в камере 4 микрофона) и убавил чувствительность почти до минимума. Так камера стала слушать меня и игнорировать музыку и шум. Подозреваю, что для других камер такая модель поведения тоже может быть оптимальной. Демонстрация работы именно такой связки есть на последнем видео. Есть подозрение, что так же очень хорошо система будет работать с сенсором kinect. Дома это так, но в машине я пока его не проверил, т.к. ему нужно дополнительное питание, а взять негде. В данный момент я занимаюсь разработкой собственной микрофонной решетки с АРУ и поиском алгоритмов обработки для неё. С ней результат обещает быть в разы лучше. |
После нажатия кнопки "активэйт" прога вылетает :(
|
Цитата:
Можете сказать, какая у вас версия windows? |
Вложений: 1
Windows 7 максимальная 64бит, пишет что микрософт сожелеет и программа будет закрыта
|
При установке speech_platform_sdk.msi вылетает окно "этот установочный пакет не поддерживается этим типом процессора". Операционка тоже Windows 7 Максимальная.
|
Вложений: 1
Цитата:
Windows 7 Ultimate видит проц так: Вложение 29469 |
Вложений: 1
прога запускается но после нажатии на активэйт то выдает ошибку:
Сигнатура проблемы: Имя события проблемы: CLR20r3 Сигнатура проблемы 01: kinectmicrophone.exe Сигнатура проблемы 02: 1.0.0.0 Сигнатура проблемы 03: 50fc29a6 Сигнатура проблемы 04: mscorlib Сигнатура проблемы 05: 4.0.30319.19050 Сигнатура проблемы 06: 50b5a7b2 Сигнатура проблемы 07: 161a Сигнатура проблемы 08: 70 Сигнатура проблемы 09: System.IO.FileNotFoundException Версия ОС: 6.1.7601.2.1.0.768.2 Код языка: 1049 Дополнительные сведения 1: 5e19 Дополнительные сведения 2: 5e19ee1c696ef6172247e218fb962904 Дополнительные сведения 3: e0f2 Дополнительные сведения 4: e0f232445a44e91e718244947c5b3175 Ознакомьтесь с заявлением о конфиденциальности в Интернете: http://go.microsoft.com/fwlink/?link...8&clcid=0x0419 Если заявление о конфиденциальности в Интернете недоступно, ознакомьтесь с его локальным вариантом: C:\Windows\system32\ru-RU\erofflps.txt Windows 7 home basic x64 я думаю проблема в .NET framework если запустить программу и закрыть то пишет это : |
Windows 7 x64, проц i3-330M, все поставил как в инструкции, ошибка обычная - без пояснений, как здесь: http://www.pccar.ru/showpost.php?p=243742&postcount=51. Т.е. прога вроде запустилась и все ок, нажимаем Активейт, проходит гдето 1-2 секунды и вылетает ошибка...
|
Да... печальные результаты. Получается ни у кого программа так и не заработала.
Это сказывается мой нулевой опыт в разработке под Windows, похоже :( Ладно, надо попробовать исправляться. Попробуйте пожалуйста установить Microsoft Speech Platform Runtime 11. Там можно выбрать под x86 или под 64 соответственно (http://www.microsoft.com/en-us/downl....aspx?id=27225) и снова запустить. Если не получится, то буду разбираться на чистой виртуальной машине. У самого получилось запустить аж на четырех разных компьютерах, но все под win7 (64 и 32). |
Цитата:
|
Цитата:
|
Кстати, ставлю на невиртуальную машину - может в этом засада у многих?
|
после установки Microsoft Speech Platform Runtime 11 все прекрасно заработало.теперь буду тестить.
|
Цитата:
|
тестирую с обычным микрофоном Genius и пробую на встроенном на ноуте Toshiba A500, с музыкой и без - конечно это не направленные, врядли в машине со всеми шумами они также отработают, имхо, но пока при 20см только улавливают довольно таки громкий спич...
|
Нужно бы в инструкцию добавить: при установки NET 4.5, сначало надо установить net 4.(тогда у меня пошло....система на вынь 7/64)
Тестил(в машине) микрофоном камеры с920. Работает сервис велликолепно...разпознает слова при включенной музыки в 95%(проговаривал в пол голоса)...при отключенной музыки при проговаривании почти шопотом, разпознается 100%, хотя камера с микрофоном стоит за солонным зеркалом. --------------------------------------------------------------------- Продолжение. Не всегда почему то проговаривает номер региона, хотя пишет(словами) правельно. |
В среднем(у меня) циферки скачат от 75 до 94 единиц(при громкости произедений, чуть ниже среднего уровня).
А дальше(по проэкту).....продолжение будет? |
Я очень рад, что появились люди, у кого это работает! Большое спасибо за тестирование!
С проблемой неподдерживаемого типа процессора буду бороться. Для джависта это все, конечно, очень дико, но что делать :-) Цитата:
Продолжение будет конечно. Как-то медленно все двигается, но двигается :) Цитата:
c920, кстати, камера очень неплохая, я тоже на ней тестировался. Но у неё был косяк - она очень сильно хватает шум. Я в комнате тестировал, где вытяжка работала, так вот на записи с камеры она её улавливала как сильный вой, хотя в реальной жизни (и на других камерах) её почти не слышно. Номер регионов говорит только в том случае, если он есть в базе программы. Возможно, там не все. Цитата:
Цитата:
|
Цитата:
Цитата:
Поиск по нету показал по типу такого: http://www.remicon.ru/prod/dict/571/ или такого: http://www.tehnoman.ru/mik_9/ (и как с 3-мя проводками подключать?) - или это совсем не то? |
Цитата:
|
Возможно добавить свою команду?
|
Чет тема умерла...Куда автор делся ?
|
Всем привет!
Прошу прощение за долгое молчание, но проект скорее всего дальше не будет развиваться, так как я увлекся другим. Если кому-нибудь будет интересно его использовать, я готов выложить наработки как open source на github. Сейчас я пошел в другом направлении - разговор на свободном языке, вот что получилось: (Видео на youtube) Думаю, истина будет лежать в интеграции этих двух технологий. |
Какие системные платформы будут поддерживаться?
|
Цитата:
|
Цитата:
Цитата:
|
Цитата:
Митяево наверное точка временного континуума....я тоже там бываю....не забываемая дорога к деревни под названием "перебери подвеску" :rofl: |
Rai220 Когда мы увидим в свет проект КУБ на андроиде. Проект бомба, за этим будущее. Готов стать тестером.
|
И где выложенный проект ?...
|
Спасибо Rai220 выложил https://github.com/Rai220/SpeechCommands Но есть вопрос - как поменять команды ,привязать их к кнопкам и как собрать в исполняющий файл ? Я думаю многим будит интересно.
|
Цитата:
|
Может кто нибудь из программистов,сможет выложить видео (хотя бы краткое)как и где поменять фразы,привязать к кнопкам и чем все это дело собрать(скомпилировать) ? Скажем так,- направить на путь истинный... Для толкового программиста,я думаю не слишком много времени понадобится...,но возможно многим поможет. Заранее СПАСИБО !
|
Что никому эта тема не интересна ?
|
Часовой пояс GMT +4, время: 09:48. |
Работает на vBulletin® версия 3.8.4.
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Перевод: zCarot