Читайте также:
|
|
Область комп'ютерного зору може бути охарактеризована як молода і різноманітна. Не зважаючи на те, що існують більш ранні роботи, можна сказати, що лише з кінця 1970-х почалося інтенсивне вивчення цієї проблеми, коли комп'ютери змогли керувати обробкою великих наборів даних, таких як зображення. Однак, ці дослідження зазвичай починалися з інших різних областей, отже, немає стандартного формулювання проблеми комп'ютерного зору. Також, і це навіть більш важливо, немає стандартного формулювання того, як повинна вирішуватися проблема комп'ютерного зору. Замість цього, існує маса методів для вирішення різних строго визначених завдань, де методи часто залежать від завдань і рідко можуть бути узагальнені для широкого кола застосування. Багато методів все ще знаходяться на стадії фундаментальних досліджень, але все більше їх число знаходить застосування в комерційних продуктах, де вони часто складають частину більш великої системи, яка може вирішувати складні завдання (наприклад, в області медичних зображень або вимірювання та контролю якості у процесах виготовлення). У більшості практичних застосувань комп'ютерного зору комп'ютери попередньо запрограмовані для вирішення окремих завдань, але методи, засновані на знаннях, стають все більш загальними.
Важливу роль в області штучного інтелекту відіграє автоматичне планування або прийняття рішень в системах, які можуть виконувати механічні дії, такі як переміщення робота через деяке середовище. Цей тип обробки зазвичай потребує вхідних даних, що надаються системами комп'ютерного зору, що діють як відеосенсор і надають високоякісну інформацію про середовище та роботу. Інші області, які іноді описуються як належні до штучного інтелекту і які використовуються в комп'ютерному баченні, це розпізнавання образів та навчальні методи. У результаті комп'ютерний зір іноді розглядається як частина області штучного інтелекту або галузі комп'ютерних наук взагалі.
Фізика є іншою наукою, яка тісно пов'язана з комп'ютерним зором. Значна частина комп'ютерного зору має справу з методами, які вимагають досконалого розуміння процесу, в якому електромагнітне випромінювання, зазвичай в області видимого або інфрачервоного діапазону, відбивається поверхнею об'єктів і вимірюється датчиком зображення, щоб отримати відеодані. Цей процес заснований на оптиці і фізиці твердого тіла. Більш складні датчики зображення навіть вимагають знання квантової механіки для повного розуміння процесу формування зображення. Також, різні проблеми вимірювань у фізиці можуть бути вирішені, використовуючи комп'ютерний зір (наприклад, пов'язані з рухом в рідинах). Тому, комп'ютерний зір може розглядатися як підрозділ фізики.
Третя область науки, яка відіграє важливу роль це нейробіологія, особливо вивчення систем біологічного зору. За останнє сторіччя, було проведено безліч досліджень очей, нейронів і структури мозку, що відносяться до обробки візуальних подразників як у людини так і у різних тварин. Це дозволило сформувати опис того, як працюють «реальні» системи зору, що допомогло вирішити деякі завдання. Результати цих досліджень привели до створення штучних систем, що імітують роботу і функціонування аналогічних біологічних систем на різних рівнях складності. Також, деякі методи вивчення, розроблені в галузі комп'ютерного зору, зобов'язані своїм походженням біології.
Ще однією областю, пов'язаною з комп'ютерним зором, є обробка сигналів. Багато методів обробки одновимірних сигналів, зазвичай тимчасових, можуть бути природним шляхом розширені для обробки двовимірних або багатовимірних сигналів у комп'ютерному зорі. Однак, через своєрідність природи зображень, існує багато методів, розроблених в області комп'ютерного зору, що не мають аналогів в області обробки одновимірних сигналів. Особливою властивістю цих методів є їх нелінійність, що, разом з багатомірністю сигналу, формує відповідну підобласть в обробці сигналів частиною області комп'ютерного зору.
Крім згаданих підходів до проблеми комп'ютерного зору, багато з досліджуваних питань можуть бути вивчені з чисто математичної точки зору. Наприклад, багато методів ґрунтуються на статистиці, оптимізаційній математиці або геометрії. Нарешті, безліч робіт ведеться в області практичного застосування комп'ютерного зору, того, як існуючі методи можуть бути реалізовані програмно і апаратно або як вони можуть бути змінені метою досягнення високої швидкості роботи без істотного збільшення споживаних ресурсів.
Комп'ютерний зір, обробка зображень, аналіз зображень, зір робота і машинний зір є тісно пов'язаними областями. Можна зробити висновок, що існує тільки одна область, яка просто має різні назви.
Обробка зображень та аналіз зображень в основному зосереджені на роботі з двомірними зображеннями, тобто перетвореннями одне зображення в інше. Наприклад, операції попіксельного збільшення контрастності, операції з виділення країв, усунення шумів або геометричні перетворення, такі як обертання зображення. Дані операції передбачають, що обробка/аналіз зображення діють незалежно від змісту самих зображень.
Комп'ютерний зір зосереджується на обробці тривимірних сцен, спроектованих на одне або декілька зображень. Наприклад, відновленням структури або іншої інформації про тривимірну сцену за одним або декількома зображеннями.
Машинний зір зосереджується в основному на промисловому застосуванні, наприклад, автономні роботи та системи візуальної перевірки та вимірювань. Це означає, що технологія датчиків зображення і теорія управління пов'язані з обробкою відеоданих для керування роботом і обробка даних в реальному часі здійснюється апаратно або програмно.
Також існує область названа візуалізація, яка пов'язана з процесом створення зображень, але також має справу з обробкою й аналізом. Наприклад, рентгенографія працює з аналізом відеоданих медичного застосування.
Нарешті, розпізнавання образів є областю, яка використовує різні методи для отримання інформації з відеоданих, в основному, засновані на статистичному підході. Значна частина цієї області присвячена практичному застосуванню цих методів.
Одним з найбільш важливих застосувань є обробка зображень в медицині. Ця область характеризується отриманням інформації з відеоданих для постановки медичного діагнозу пацієнтам. У більшості випадків, відеодані отримують за допомогою мікроскопії, рентгенографії, ангіографії, ультразвукових досліджень і томографії. Прикладом інформації, яка може бути отримана з таких відеоданих є виявлення пухлин, атеросклерозу або інших злоякісних змін. Також прикладом може бути вимір розмірів органів, кровотоку і т.д. Ця прикладна область також сприяє медичним дослідженям, надаючи нову інформацію, наприклад, про будову мозку або якість медичного лікування.
Іншою прикладної областю комп'ютерного зору є промисловість. Тут інформацію отримують для підтримки виробничого процесу. Прикладом може служити контроль якості, коли деталі або кінцевий продукт автоматично перевіряються на наявність дефектів. Іншим прикладом є вимірювання положення та орієнтації деталей, що піднімаються рукою робота.
Військове застосування є, мабуть найбільшою областю комп'ютерного зору. Очевидними прикладами є виявлення ворожих солдатів і транспортних засобів та управління ракетами. Найбільш досконалі системи управління ракетами посилають ракету в задану область не маючи конкретної мети, а селекція цілей виробляється коли ракета досягає заданої області, ґрунтуючись на одержуваних відеоданих. Сучасне військове поняття, таке як «бойова поінформованість», має на увазі, що різні датчики, включаючи датчики зображення, надають великий набір інформації про поле бою, яка може бути використана для прийняття стратегічних рішень. У цьому випадку, автоматична обробка даних використовується, щоб зменшити складність або збільшити надійність отримуваної інформації.
Однією з нових областей застосування є автономні транспортні засоби, включаючи підводні, наземні (роботи, машини), повітряні. Рівень автономності змінюється від повністю автономних (безпілотних) до транспортних засобів, де системи, засновані на комп'ютерному зорі, підтримують водія або пілота в різних ситуаціях. Повністю автономні транспортні засоби використовують комп'ютерний зір для навігації, тобто для отримання інформації про місце свого перебування, для створення карти навколишнього оточення, для виявлення перешкод. Вони також можуть бути використані для певних завдань, наприклад, для виявлення лісових пожеж. Прикладами таких систем можуть бути системи попереджувальної сигналізації про перешкоди на машинах і системи автономної посадки літаків. Деякі виробники машин демонструють системи автономного управління автомобілем, але ця технологія все ще не досягла того рівня, коли її можна запустити у масове виробництво.
Інші області застосування включають:
1) Підтримку створення відеоефектів для кіно і телебачення.
2) Спостереження.
Кожна з областей застосування комп'ютерного зору, описаних вище, пов'язана з низкою завдань. Деякі приклади типових завдань комп'ютерного зору представлені нижче.
Розпізнавання.
Класична задача в комп'ютерному зорі, обробці зображень і машинному зорі це визначення чи містять відеодані деякий характерний об'єкт, особливість або активність. Це завдання може бути достовірно і легко вирішене людиною, але до цих пір не вирішене задовільно в комп'ютерному зорі в загальному випадку: випадкові об'єкти у випадкових ситуаціях.
Існуючі методи вирішення цієї задачі ефективні тільки для окремих об'єктів, таких як прості геометричні об'єкти (наприклад, багатогранники), людські обличчя, друковані чи рукописні символи, автомобілі і тільки в певних умовах, звичайно це певне висвітлення, фон і положення об'єкта відносно камери.
У літературі описано безліч проблем розпізнавання:
Розпізнавання: один або кілька попередньо заданих або вивчених об'єктів або класів об'єктів можуть бути розпізнані, зазвичай разом з їх двомірним становищем на зображенні або тривимірним становищем в сцені.
Ідентифікація: розпізнається індивідуальний екземпляр об'єкта. Приклади: ідентифікація певного людського обличчя, відбитків пальців або автомобіля.
Виявлення: відеодані перевіряються на наявність певної умови. Наприклад, виявлення можливих неправильних клітин або тканин у медичних зображеннях. Виявлення, що базується на відносно простих і швидких обчисленнях іноді використовується для знаходження невеликих ділянок в аналізованому зображенні, які потім аналізуються за допомогою прийомів, більш вимогливих до ресурсів, для отримання правильної інтерпретації.
Існує кілька спеціалізованих завдань, заснованих на розпізнаванні, наприклад:
Пошук зображень за змістом: знаходження всіх зображень у великому наборі зображень, які мають певний зміст. Зміст може бути визначено різними шляхами, наприклад схожість з конкретним зображенням, або більш високорівневі критерії пошуку, що вводяться як текстові дані. Наприклад: знаходження всіх зображення, на яких зображено багато будинків, які зроблені взимку і на яких немає машин.
Оцінка положення: визначення положення або орієнтації певного об'єкта щодо камери. Прикладом застосування цієї техніки може бути сприяння руці робота в отриманні об'єктів зі стрічки конвеєра на лінії збирання.
Оптичне розпізнавання знаків: розпізнавання символів на зображеннях друкованого або рукописного тексту, зазвичай для перекладу в текстовий формат, найбільш зручний для редагування або індексації (наприклад, ASCII).
Рух
Кілька завдань, пов'язаних з оцінкою руху, в яких послідовність зображень (відеодані) обробляються для знаходження оцінки швидкості кожної точки зображення або 3D сцени.
Прикладами таких завдань є:
1) Визначення тривимірного руху камери.
2) Стеження, тобто слідування за переміщеннями об'єкта (наприклад, машин або людей)
Дата добавления: 2015-10-21; просмотров: 297 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Аналіз проблеми та постановка задачі | | | Відновлення зображень |