Оригінальна стаття: https://faculty.cc.gatech.edu/~parikh/human_debugging/
(NSF IIS 1115719, 1341772)
PI: Деві Паріх
Анотація
Проблема візуального розпізнавання є фундаментальною для досягнення мети автоматичного розуміння зображення. Незважаючи на те, що в спільноті комп’ютерного бачення було докладено чимало зусиль, продуктивність машин у цих завданнях залишається значно нижчою за здатність людини.
Головною метою цього проекту є використання найвідомішої системи візуального розпізнавання – системи візуального розпізнавання людини. У цьому проекті використовується парадигма «Налагодження людиною», щоб замінити різні компоненти конвеєра машинного зору людьми, і досліджується результат, що впливає на ефективність розпізнавання. Значущі порівняння дають цінну інформацію та визначають аспекти конвеєра машинного бачення, які є вузькими місцями продуктивності та вимагають подальших досліджень. Зокрема, проект розглядає проблеми класифікації зображень і виявлення об’єктів, а також досліджує роль локальної та глобальної інформації, а також часткове виявлення, просторове моделювання та контекстне міркування (включаючи немаксимальне придушення) для цих проблем відповідно.
Цей проект стосується широкого кола проблем візуального розпізнавання, включаючи розпізнавання об’єктів, розпізнавання сцен і виявлення об’єктів. Ця нова парадигма виявлення слабких ланок в обчислювальних моделях за допомогою людей у циклі також застосовна до інших проблем із зором, а також до інших підполей ШІ. Обмінюючись усіма зібраними даними та результатами, а також організовуючи конференції та семінари, цей проект започаткує та підживить діалог із дослідницьким співтовариством щодо використання людей для вдосконалення комп’ютерного зору. У більш широкому плані ця робота заохочує залучення молодих жінок і студентів до досліджень інформатики.
Набори даних
Набір даних атрибутів відносного обличчя (29 атрибутів, 60 категорій)
Публікації (частково підтримані NSF)
|
A. Bansal , A. Kowdle , D. Parikh, AC Gallagher та CL Zitnick Семінар з 3D-представлення та розпізнавання (3dRR) |
|
Р. Моттагі , С. Фідлер , Дж. Яо , Р. Уртасун і Д. Паріх Аналіз семантичної сегментації за допомогою гібридних людино-машинних CRF Конференція IEEE з комп’ютерного зору та розпізнавання образів (CVPR), 20 13 [ плакат ] |
|
CL Zitnick і D. _ Парих Роль розуміння зображення у визначенні контурів Конференція IEEE з комп’ютерного зору та розпізнавання образів (CVPR), 20 12 [ сторінка проекту ] [ дані ] [ плакат ] |
|
D. Parikh , CL Zitnick і T. Chen Дослідження маленьких зображень: роль зовнішнього вигляду та контекстної інформації для розпізнавання об’єктів машиною та людиною Аналіз шаблонів і машинний інтелект (PAMI), 2012 (з’явиться) |
|
Д. Паріх і Ч. Л. Зітник Другий семінар з обчислювальної соціальної науки та мудрості натовпу Нейронні системи обробки інформації (NIPS), 20 11 |
|
Д. Парих Розпізнавання змішаних зображень: роль локальної та глобальної інформації в класифікації зображень Міжнародна конференція з комп’ютерного зору (ICCV) , 2011 |
|
Вилучення адаптивних контекстних сигналів із немаркованих областей Міжнародна конференція з комп’ютерного зору (ICCV) , 2011 [ сторінка проекту ] |
|
CL Zitnick і D. _ Парих Концентрація семантики за допомогою візуальної абстракції Конференція IEEE з комп’ютерного зору та розпізнавання образів (CVPR), 20 13(Усно) [ сторінка проекту та дані ] [розмова (відео)] [слайди] [постер] |
|
А. Бісваста Д. Паріх Одночасне активне вивчення класифікаторів і атрибутів через відносний зворотний зв’язок Конференція IEEE з комп’ютерного зору та розпізнавання образів (CVPR), 20 13 [ плакат ] [ сторінка проекту та дані ] [ демо ] Демо на конференції IEEE з комп’ютерного зору та розпізнавання образів (CVPR), 20 13 Н. Агравал, А. Бісвас, А. Ковашка, К. Грауман і Д. Паріх. |
Пов’язані публікації (до підтримки NSF)
|
D. Parikh та C. L. Zitnick Finding the Weakest Link in Person Detectors IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , 2011 [ сторінка проекту ] [ дані ] [ постер ] [ слайди ] |
|
Д. Паріх і Ч. Л. Зітник Роль функцій, алгоритмів і даних у візуальному розпізнаванні Конференція IEEE з комп’ютерного зору та розпізнавання образів (CVPR) , 2010 |
Підтримано аспірантів
Підтримка студентів бакалаврату
Яш Сет
Наман Агравал
Цзюлін Ван