КомпјутериИнформатичката технологија

Современите компјутерски визија. Задачи и компјутерска визија технологија. Програмирање Компјутерска визија во Python

Како да се учат на компјутер да се разбере она што е прикажано на слика или слики? Ова се чини едноставна, но за компјутер, ова е само една матрица составена од нули и единици од која што сакате да ја извадиме важни информации.

Што е компјутерска визија? Тоа е способност да "види" вашиот компјутер

Визија - е важен извор на информации за лицето што го користи, ние се добие, според различни проценки, 70-90% од сите информации. И, се разбира, ако сакаме да се создаде паметни автомобил, ние треба да се имплементираат истите вештини и компјутер.

Проблемот на компјутерска визија може да се каже сосема јасно. Што е "види"? Разбирливо е дека таму каде што се само со гледање. Кои склучиле договор за разликите на компјутерска визија и човечки вид. Визија за нас - тоа е извор на знаење за светот, како и извор на метрички информации - тоа е, на способноста да се разбере растојанија и големини.

Семантички јадрото на сликата

Гледајќи во сликата, ние може да се опише со голем број на атрибути, така да се каже, да се извлечат семантички информации.

На пример, гледајќи на оваа слика, може да се каже дека тоа е отворено. Што е градскиот сообраќај. Дека постојат автомобили. ние може да се претпостави дека ова е Југоисточна Азија за конфигурација на зградата и хиероглифи. Портретот на Мао Це Тунг се разбере дека тоа е во Пекинг, и ако некој видел во живо на видео или самиот бил таму, би се претпостави дека тоа е познатиот плоштад Тјенанмен.

Што може да се каже повеќе за слика, гледајќи? Ние може да се идентификуваат објектите во сликата, да се каже, дека има луѓе тука поблиску - оградата. Еве чадори, постери кои зградата. Ова се примери на часови е многу важно објекти, кои се ангажирани во потрага за миг.

Ние се уште може да се научи на некои од карактеристиките или атрибути на објекти. На пример, тука може да се утврди дека тоа не е портрет на обичните кинески, имено, Мао Це Тунг.

Според возилото може да се утврди дека се движат објект, а тоа е тешко, тоа не е деформиран во текот на движењето. За знамиња може да се рече дека се противи, тие се, исто така, се движат, но тие не се тешки, постојано се деформира. И во сцената постои ветер, кој може да се утврди од страна на развој на знамиња, па дури и може да се одреди правецот на ветрот, на пример, тоа дува од лево кон десно.

На растојанија и должини во компјутерска визија

Многу важно е метрички информации за компјутерска визија науката. Ова е за сите видови на растојанија. На пример, за роверот е особено важно, бидејќи екипи се од Земјата околу 20 минути и одговори на толку многу. Соодветно на тоа, линк таму и назад - 40 минути. И ако се направи план за движење команди на Земјата, ќе треба да се земе тоа во предвид.

Успешно интегрирани технологијата на компјутерска визија во видео игри. Според видео, може да се изгради три-димензионални модели на објекти, луѓе, и слики на корисникот може да се врати на три-димензионални модели на градовите. А потоа одиме на нив.

компјутерска визија - прилично широк спектар. Тоа е тесно испреплетени со разни други науки. Дел од компјутерска визија Таа фаќа областа на обработка на сликата, а понекогаш и издвојува компјутерска визија, историски.

Анализа, Препознавање на моделот - патот кон создавање на супериорна интелигенција

Да ги разгледаме овие концепти одделно.

Обработка на слика - ова е област на алгоритми, во кои за влез и излез - слика, и ние треба да го направи нешто.

анализа на слика - е од областа на компјутерска визија, која се фокусира на работи со две-димензионална слика и да се направи заклучоци од тоа.

Препознавање на моделот - апстрактен математички дисциплина која го признава податоци во форма на вектори. Тоа е, на влезот - вектор и имаме нешто да се направи со неа. Каде што векторот е, ние не сме толку важно да се знае.

Компјутерска визија - тоа беше првично да се обнови структурата на две-димензионални слики. Денес оваа област стана пошироко и тоа може да се толкува како прифаќање на сите физички објекти што, врз основа на сликата. Тоа е, тоа е задача на вештачката интелигенција.

Паралелно со компјутерска визија во една сосема поинаква област, геодезија, фотограметрија еволуираше - мерење на растојанието меѓу објектите на две-димензионални слики.

Роботите можат да се "гледаат"

И конечно - ова е машина визија. Според видот на машината значи визија на роботите. Тоа е одлуката на некои производствени проблеми. Можеме да кажеме дека компјутерска визија - е една голема наука. Тоа е комбинација на некои од другите науки дел. И кога визијата на компјутер добива некоја посебна примена, тоа се претвора во визијата од една машина.

Компјутерска визија регион има маса на практични апликации. Тоа е поврзано со автоматизација на производството. На претпријатијата да станат поефикасни за да го замени мануелната работа со машина. Машината не се уморни, не спијат, таа имаше неправилни распоред работа, таа е подготвена да работи 365 дена во годината. Значи, со користење на работата на машината, ние може да се добие гарантира резултат, во одредено време, а тоа е доста интересно. Сите задачи имаат јасна употреба за системи за компјутерска визија. И не постои ништо подобро отколку да се видат резултатите веднаш на сликата само во фаза на пресметката.

На прагот на светот на вештачката интелигенција

Плус област - тоа е тешко! Еден значаен дел од мозокот одговорен за визија, и се верува дека ако учат вашиот компјутер за да "види", што е, на целосна употреба компјутерска визија, тоа е една од целите на целосна вештачката интелигенција. Ако можеме да го реши проблемот на човечкото ниво, најверојатно, во исто време, ние ќе го реши проблемот на АИ. Тоа е многу добро! Или не е многу добра, ако се погледне, "Терминатор 2".

Зошто е визија - тоа е тешко? Бидејќи сликата на истиот објект може да се разликува во зависност од надворешните фактори. Во зависност од објектот на набљудување поени изгледаат различно.

На пример, една и иста личност, земени од различни агли. И што е најинтересно во оваа бројка може да биде едно око, две очи и половина. И во зависност од контекстот (ако оваа слика на човекот во кошула со насликани очите), окото може да биде повеќе од две години.

Компјутерот се уште не го разбира, но тоа "гледа"

Друг фактор што го прави тешко - тоа е за осветлување. На истата сцена со различни осветлување ќе изгледа различно. големина на објектот може да се разликуваат. Покрај тоа, на објекти на која било класа. Како може да се каже за човек кој неговата висина од 2 метри? Ништо. Човековиот раст и може да биде 2,3 метри, и 80 см. Како и со другите видови на предмети, сепак, се објекти од иста класа.

Особено живи предмети се подложат на различни видови. Коса луѓе, спортисти, животни. Се погледне на слики на коњи работи, се утврди што се случува со нивните грива и опашка е едноставно невозможно. А преклопуваат објекти во сликата? Ако бутам компјутер слика, дури и на најмоќните машина многу тешко да се даде на правилна одлука.

Next view - тоа е себе. Некои предмети, животни маскиран како на животната средина, и доста вешто. И на истите места и боење. Сепак, ние ги гледаме, иако не секогаш од далеку.

Уште еден проблем - движење. Предмети во движење незамисливи подложат деформација.

Многу од предметите се многу променливи. Еве, на пример, во две слики подолу објектите на "Чаир".

И на ова може да се седи. Но, да се учат на машина, така што различни нешта во форма, боја, материјал, сè е објект "стол" - е многу тешко. Ова е предизвик. Да се интегрираат методи на компјутерска визија - е да се учат на машината за да се разбере, се анализира, се шпекулира.

Интеграција на компјутерска визија во различни платформи

Масата на компјутерска визија почна да навлезат во 2001 година, кога тој ја создал првата детектор лице. Виола, Џонс: Ние тоа двајца автори направени. Тоа беше првиот брз и сигурен доволно алгоритам, кој покажа моќта на методи на машинско учење.

Сега компјутерска визија има доволно нови практични апликации - признавање на човечкото лице.

Но, да се препознае човекот, како во филмовите - по случаен избор агли, различни услови на осветлување - тоа е невозможно. Но, за да се реши проблемот, или оној кој е во различни луѓе со различни осветлување или во различна поза, слично како и во фотографијата во пасошот, можно е со висок степен на доверба.

барања пасош слика во голема мера се должи на функција на алгоритми за препознавање на лице.

На пример, ако имаат биометриски пасош, во некои модерни аеродроми, можете да го користите автоматски систем за пасошка контрола.

Нерешениот проблем на компјутерска визија - способноста да се препознае некој текст

Можеби некој користи OCR систем. Еден од нив - на ликовни Reader, е многу популарна во RuNet систем. Постојат многу форми каде што ќе се пополни во податоците, тие се совршено скенирани, информациите е призната од страна на системот многу добро. Но, со било кој текст на сликата ситуацијата е многу полоша. Овој проблем се уште останува нерешен.

Игри кои вклучуваат компјутерска визија, движење фаќање

Посебен голема површина - е создавање на три-димензионални модели и движење фаќање (што е доста успешно имплементирани во компјутерски игри). На првата програма, која користи компјутерска визија - систем на интеракција со компјутер со помош на гестови. Кога беше создадена тоа беше многу работи отворени.

Алгоритмот е дизајниран едноставно, но за да го конфигурирате го зеде за да се создаде генератор на синтетички слики на луѓе да се добие еден милион слики. Суперкомпјутер со нив да се избере параметрите на алгоритам, за кои тој сега работи добро.

Тоа е еден милион слики и недела можен рок преброим суперкомпјутер за да се создаде алгоритам кој троши 12% од капацитетот на еден процесор и овозможува на едно лице да се согледа позиција во реално време. Овој систем на Мајкрософт Kinect (2010).

Барај слики со содржина ви овозможува да испратите фотографии на системот, како и резултатите од тоа ќе им даде на сите слики со иста содржина и направени од истиот агол.

Примери на компјутерска визија: три-димензионални и две-димензионални карти сега се направи со неа. Мапи за навигација автомобили редовно се ажурира според DVR.

Постои база на податоци со милијарди гео-ознаки на фотографии. Со преземање на слики во базата на податоци, може да се утврди каде што е направен, па дури и со некои перспектива. Се разбира, под услов дека местото е доволно популарна на едно време туристите и направи голем број на фотографии од областа биле таму.

роботи се насекаде

Роботика во сегашно време, насекаде, без него во било кој начин. Сега постојат возила кои имаат специјални камери кои ја признаваат пешаците и сообраќајни знаци за пренос на команди на возачот (ова на начин на компјутерска програма за да ја видите, му помага на возачот на автомобилот). И таму е целосно автоматизирана роботски возила, но тие не можат да се потпираат единствено на системот за видео камера без употреба на голема количина на дополнителни информации.

Модерни камера - ова е обскура аналогна камера

Ајде да зборуваме за дигитални слики. Современите дигитални фото апарати се организира на принципот на обскура камерата. Само, наместо дупка преку која светлината влегува во светло и проектирани на задниот ѕид на комората на предметот коло, имаме посебни оптички систем наречен објективот. Нејзината цел е да се соберат голем зрак светлина и да го претворите така што сите зраци поминале низ еден виртуелен точка, со цел да се добие на проекција и се формира слика на филм или матрица.

Современите дигитални камери (матрица) е составен од поединечни елементи - пиксели. Секој пиксел може да се мери енергијата на светлината што е инцидент на вкупниот број на пиксели, и издаде еден излез број. Затоа, во дигитална камера, ќе го добиеме наместо осветленоста на сликата во собата светлина мерења, фатени во еден пиксел - компјутерот видното поле. Затоа, кога сликата гледаме не тече линии и јасни контури, и мрежа од обоени квадрати во различни бои - пиксели.

Подолу можете да ја видите првата дигитална слика во светот.

Но, во оваа слика не е? Боја. Што е боја?

Психолошка перцепција на бојата

Боја - тоа е она што го гледаме. Бојата на една и иста работа за луѓето и мачките ќе бидат различни. Бидејќи ние (луѓето) и животински оптички систем - визијата е поинаква. Затоа, на боја - тоа е психолошки квалитет на нашата визија, која се јавува при набљудувањето објекти и светлина. А не физичка сопственост на објектот и светлина. Боја - е резултат на интеракцијата на светлината компоненти, и на местото на нашиот визуелен систем.

Програмирање Компјутерска визија во Python користење библиотеки

Ако сте се одлучиле да се вклучат сериозно во студијата на компјутерска визија, веднаш треба да се подготви за голем број на проблеми, оваа наука не е најлесната и се крие голем број на стапици. Но, "Програмирање Компјутерска визија на Пајтон" авторството на Јан Ерик Solema - книга која ги истакнува сите повеќето едноставен јазик. Овде ќе се запознаат со методите на признавање на разни објекти во 3D, да научат да работат со слика стерео, виртуелната реалност и многу други апликации на компјутерски визија. Во книгата се доволно примери во Python. Но, објаснувањата се презентирани, така да се каже, се генерализира, така што нема да преоптоварување премногу истражување и тешко податоци. Работа погодна за ученици, аматери, и ентузијасти. Симни ја оваа книга и другите за компјутерска визија (PDF формат) може да биде во мрежата.

Во моментов, постојат отворен код библиотека на компјутерска визија алгоритми и обработка на слики и нумерички алгоритми OpenCV. Се спроведува на повеќето модерната програмски јазици, софтвер со отворен код. Ако зборуваме за компјутерска визија, Python користи како програмски јазик, исто така, ја има поддршката на библиотеката, покрај тоа, таа е постојано се развива и има голема заедница.

Компанијата "Мајкрософт" нуди своите услуги Api-можност да се обучуваат на нервните мрежа да се работи со слики од луѓе. Исто така постои и можност да ги применат компјутерска визија, Python користи како програмски јазик.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 mk.delachieve.com. Theme powered by WordPress.