Читайте также:
|
|
Векторная графика
Интегрированные документы (текст и изображения)
Интегрированные аудио и видео
Универсальные интегрированные мультимедийные презентации
Требования к модели данных для мультимедиа:
- Должна поддерживать мультимедийные типы данных (текст, изображения, звук и т.д.); не должно быть обычных файловых ссылок на оптический или иной носитель, что распространено в расширениях реляционной модели или ОО модели данных
- Должна поддерживать поиск по содержимому любого типа мультимедийных данных (например, поиск по всему тексту, или поиск заданного лица по фотографиям)
Образ - классификационная группировка в системе классификации, объединяющая (выделяющая) определенную группу объектов по некоторому признаку. Каждое отображение какого-либо объекта на воспринимающие органы распознающей системы, независимо от его положения относительно этих органов, принято называть изображением объекта, а множества таких изображений, объединенные какими-либо общими свойствами, представляют собой образы
Распознавание — отнесение предъявляемых объектов к определённым классам с помощью применения известных правил классификации. Это наиболее типичная задача систем распознавания. Перед тем, как система сможет выполнять данную функцию, предполагается её обучение на множестве примеров — обучающей выборке
объектов распознавания
Примеры задач распознавания образов:
- Распознавание букв;
- Распознавание штрих-кодов;
- Распознавание автомобильных номеров;
- Распознавание лиц и других биометрических данных;
- Распознавание речи.
В целом, можно выделить три метода распознавания образов:
· Метод перебора. В этом случае производится сравнение с базой данных, где для каждого вида объектов представлены всевозможные модификации отображения. Например, для оптического распознавания образов можно применить метод перебора вида объекта под различными углами, масштабами, смещениями, деформациями и т. д. Для букв нужно перебирать шрифт, свойства шрифта и т. д. В случае распознавания звуковых образов, соответственно, происходит сравнение с некоторыми известными шаблонами (например, слово, произнесенное несколькими людьми).
· Второй подход - производится более глубокий анализ характеристик образа. В случае оптического распознавания это может быть определение различных геометрических характеристик. Звуковой образец в этом случае подвергается частотному, амплитудному анализу и т. д.
· Следующий метод - использование искусственных нейронных сетей (ИНС). Этот метод требует либо большого количества примеров задачи распознавания при обучении, либо специальной структуры нейронной сети, учитывающей специфику данной задачи. Тем не менее, его отличает более высокая эффективность и производительность. Подробно нейронные сети мы рассматривали в "КИ" N 15, 16, 17 за 2005 г.
Если говорить кратко, то сжатие устраняет из данных избыточность, в терминах же теории информации сжатие увеличивает энтропию сжатого текста.
При сжатии без потерь преобразование данных выполняется так, что с помощью обратного преобразования можно получить данные, полностью совпадающие с исходными. Сжатие с потерями создает такое представление, из которого можно извлечь данные, которые " очень похожи " на исходные. Преимущество сжатия с потерями в том, что оно зачастую позволяет получить более компактное представление данных, чем то, которое получается в результате сжатия без потерь. Чаще всего сжатие с потерями используется для изображений, звуковых и видеофайлов. Сжатие с потерями подходит в этом случае благодаря тому, что человек не воспринимает цифровые изображения и звук с "побитовой" точностью, а скорее оценивает музыку или изображение в "целом".
Применение в СУБД экономного кодирования без потерь информации приводит к ряду положительных результатов. Наиболее очевидным эффектом является уменьшение физического размера базы данных, журнальных и архивных файлов. Но также часто достигается увеличение скорости выполнения запросов и снижение требований к объему оперативной памяти, что отмечается практически во всех работах в данной области знаний. Поэтому эффективная реализация поддержки сжатия данных существенно улучшает качество СУБД.
Существует достаточно много универсальных (обратимых) методов сжатия, однако в их основе лежит сравнительно небольшое количество теоретических алгоритмов, которые мы рассмотрим на примерах.
Метод упаковки. Идея метода упаковки заключается в уменьшении количества бит, отводимых для кодирования каждого объекта, при условии, что в сжимаемом массиве данных присутствует не весь возможный набор объектов, а только его небольшая часть.
Сообщение «КОЛ ОКОЛО КОЛОКОЛА» записанное в кодировке ASCII будет весить
Vascii=8бит • 18 символов = 144 бита, а кодировке Unicode соответственно Vunicode = 16 бит • 18 символов = 288 бит.
Однако данное сообщение содержит всего 5 различных символов, следовательно, каждый символ может быть закодирован тремя битами, например, так: «А» - 000, «К» - 001, «Л» - 010, «О» - 011 и пробел - 111. Тогда объем сообщения будет равен V=18 символов • 3 бит = 54 бита.
Дата добавления: 2015-11-16; просмотров: 96 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Критерии оценки качества рубрицирования | | | Преимущества использования БД |