Закрыть
Все сервисы
Главная
Лента заметок
Теги
Группы
Рейтинги
see_the_lightЛента заметок группы: ~Инерция и обструкция ^ интегральный подход~

Безрассудная наука

16 декабря´08 0:28 Просмотров: 167 Комментариев: 0
Несмотря на то, что я - ученый по профессии, я действительно чувствую, что наука безрассудна. Я помню, что сказал Архимед более чем две тысячи лет назад: «Дайте мне рычаг достаточной длины, и опору, достаточно сильную, и я смогу перевернуть мир». Пока что-либо может быть обнаружено, или могут быть найдены инструменты, наука приложит все усилия, чтобы копать глубже.



Моя лаборатория изучает обработку фонетического сигнала и сосредотачивается на фонетическом опознавании. Короче говоря, фонетическое опознавание позволяет машинам, включая компьютеры, понимать то, что Вы говорите. За исключением человеческого мира, живые существа из других пространств будут думать, что это исследование забавно и раздражающе. Как упомянуто в : «Не только человек, но и животные, и растения имеют жизнь, в других пространствах жизнь проявляется в любом веществе. Когда твоё небесное око откроется на уровне «зрения глаза Закона», ты обнаружишь, что камни, стены – любые предметы – разговаривают, здороваются с тобой». Так как вещи могут понимать наши слова, почему мы пробуем, различными способами, изобрести машину, которая будет слышать нашу речь?



Процесс фонетического опознавания следующий. Сначала, мы берем часть звуков человеческой речи как образец, раскладываем в ряд Фурье, передаём сигналы через электрический фильтр, состав которого очень сложен, и получаем ряд характерных параметров. Тогда мы сравниваем эти параметры с большим объёмом человеческих фонетических данных, которые были сохранены в базе данных. Известное произношение уже было присоединено к каждой части фонетических данных в базе данных. Так, после сравнения, произношение фонетических данных, самое близкое по сравнению с образцом будет результатом опознавания.



Есть несколько проблем с таким подходом. Сначала, процесс осуществления отбора, что чрезвычайно усложняет сигналы. Например, с частотой отбора 48 кГц, 5 секундный звук будет взят как образец из 240 000 чисел. Только компьютер может прочитать и обработать так много чисел. После того, как мы преобразовываем звук в эту числовую форму, которую человек не может охватить, мы должны проработать это со всеми видами фильтров, чтобы убрать фоновый шум, отличить спикера, создать модель голосовых связок человека, и т.д. Мы используем много передовой математики, чтобы решить эту проблему. Даже в этом случае, решение, которое мы получаем - только вероятность. Произношение, которое имеет наибольшее совпадение, может быть решением. Результат опознавания предполагает, что произношение, возможно, будет словом. Если мы проводим фонетическое опознавание в ограниченной области, норма правильности - приблизительно 70 - 90 процентов. Что такое ограниченная область? Это означает, что ваша тема ограничена определенными возможностями словаря, например, физические упражнения. Как только Вы выходите за пределы этой темы, например в политику, норма правильности опознавания резко снижается.



Оказывается, что первый шаг осуществление отбора - является началом ошибки. Это преобразование 5 секундного звука в 240 000 чисел. Так как эти числа слишком проблематичны для обработки, мы проводим сигналы через электронный фильтр, раскладываем в ряд Фурье, и перемещаем сигналы из области времени в область частоты. Даже в этом случае, сигналы все ещё слишком сложные. Что мы можем сделать? Мы возьмем характерные параметры и сократим сигналы до 42 параметров, которые могут быть обработаны. Тогда мы сравниваем эти параметры с данными, сохраненными в базе данных. Поскольку слишком много информации было потеряно во время обработоки, единственная вещь, которую мы можем теперь сделать, это вычислить вероятность - произношение сравнивается со звуком с самой высокой вероятностью. Результат вычисления все ещё не очень хорошо работает, таким образом, всё это уплотняется в соответствии с моделирующей язык программой. И, наконец, мы увеличиваем норму опознавания к приемлемому уровню.



Не говорите, что это - дух Старого Глупого Человека (легендарный китайский фольклорный персонаж, кто пытался передвинуть гору перед его домом, перемещая по одному камню за раз). Фактически, всё это выглядит как безрассудная работа. Почему мы используем такой глупый метод, чтобы достигнуть цели? Потому что этот метод самый «передовой», предлагаемый наукой. Так как наука не может обеспечить лучшее решение, единственная вещь, которую ученый может теперь делать, это продолжать отчаянно работать с этим невежественным методом.



Собака может инстинктивно понять, счастлив ли её владелец, сердится он или грустит, без какого-либо обучения. У растения есть сверхспособность - телепатия. Почему же люди идут против природы и хотят, чтобы электронный хрустальный шар «понял» слова людей?



Практикующий из Тайваня
Группа: ~Инерция и обструкция ^ интегральный подход~
Пожаловаться
Комментариев (3)
Отсортировать по дате Вниз
ZeL  (аноним)  16.12.2008, 01:23
Оценка:  0
ZeL
Да не бойся - это наука тоже объяснит :02:
ZeL  (аноним)  16.12.2008, 01:00
Оценка:  0
ZeL
Спасибо! Полезная информация! :02: Аж легче стало :02: :02:
see_the_light    16.12.2008, 01:00
Оценка:  0
see_the_light
мне от твоей аватары плохо стало (