Конференция по извлечению знаний и анализу данных

Конференция по извлечению знаний и анализу данных (англ. Knowledge Discovery and Data Mining Conference, KDD) — ежегодная международная конференция, организуемая Специальной группой интересов по извлечению знаний и анализу данных (SIGKDD) Ассоциации вычислительной техники (англ. Association for Computing Machinery, ACM). Является одной из самых влиятельных научных площадок в области интеллектуального анализа данных и поиска закономерностей в больших наборах данных[1].

История конференции

Конференция KDD выросла из серии воркшопов по извлечению знаний и анализу данных, проходивших в рамках конференций по искусственному интеллекту AAAI начиная с 1989 года под руководством Григория Пяточного-Шапиро и Усамы Файяда[2]. С 1995 года конференция проводится ежегодно; Специальная группа интересов SIGKDD официально была создана в составе ACM в 1998 году[3]. Все доклады публикуются через ACM[4].

KDD признана ведущим форумом для публикации результатов исследований по интеллектуальному анализу данных[5]. По данным анализа Лексин Си за 1994—2015 годы на конференции было опубликовано 4489 работ, получивших в сумме 112 570 цитирований в 3033 изданиях, более половины которых относятся к топ-25 научных журналов в этой области[6].

Конференция SIGKDD ежегодно отмечается как флагманское событие в области анализа данных, входящее в высший рейтинг A* организации Computing Research and Education (CORE)[7].

Год Место проведения конференции
2011 Сан-Диего, США
2012 Пекин, Китай
2013 Чикаго, США
2014 Нью-Йорк, США
2015 Сидней, Австралия
2016 Сан-Франциско, США
2017 Галифакс, Канада
2018 Лондон, Великобритания
2019 Анкоридж, США
2020 Сан-Диего, США
2021 Виртуальная конференция
2022 Вашингтон, округ Колумбия, США
2023 Лонг-Бич, США
2024[8] Барселона, Испания
2025 Торонто, Канада

Критерии отбора

Как и другие ведущие конференции, SIGKDD предъявляет высокие требования к качеству публикаций, отдавая предпочтение инновационным исследованиям в анализе данных, извлечении знаний, масштабной аналитике. Предпочтение отдаётся работам с серьёзной теоретической базой, оригинальным моделям и подходам в научных, бизнес-, медицинских и инженерных задачах. Инкрементальные или мало значимые работы принимаются крайне редко[9].

В 2014 году конференция получила более 1000 заявок от более чем 2600 авторов из не менее четырнадцати стран; к публикации было принято всего 151 доклад, то есть уровень принятия составил 14,6 %. Этот показатель ниже, чем у большинства топовых конференций по информатике (15-25 %), что свидетельствует о высокой конкуренции и значимости площадки[10][11]. Однако, низкий процент приёма является лишь косвенным признаком качества — более высокая конкуренция не всегда означает более сильный вклад[12].

Награды

SIGKDD ежегодно вручает премии за инновации и за вклад в сообщество KDD[13]. Кроме того, вручаются награды за лучшую работу и лучшую студенческую работу конференции[14][15].

Лучшая работа

Получение награды SIGKDD за лучшую исследовательскую работу считается значительным международным признанием в академической и индустриальной карьере исследователя[16][17]. Награда вручается авторам работ, внёсших наибольший вклад в развитие фундаментальных идей в области извлечения знаний из данных.

Процесс отбора

Кандидаты проходят многоуровневое экспертное рецензирование по строгим критериям; членами жюри выступают признанные специалисты, не связанные с авторами работ. Оцениваются новизна, техническое качество, значимость результатов, чёткость изложения, прозрачность и воспроизводимость экспериментов[9]. Финалисты определяются на основании максимального продвижения области, показанного в работе.

Лауреаты прошлых лет

Премия SIGKDD за лучшую исследовательскую работу вручалась с 1997 года следующим лицам:

Год Имя Должность Организация
1997 Фостер Провост профессор Нью-Йоркский университет
1997 Том Фосетт ведущий дата-сайентист Silicon Valley Data Science
1998, 1999 Педро Домингос профессор Университет Вашингтона
2000 Энн Роджерс доцент Чикагский университет
2000 Дэрил Прегибон (бывш.) глава отдела статистики AT&T Labs и Bell Labs
2000 Кэтлин Фишер заведующая кафедрой, профессор Университет Тафтса
2000 Коринна Кортес руководитель исследований Google
2001 Рубен Х. Замар профессор Университет Британской Колумбии
2001 Рэймонд Нг профессор Университет Британской Колумбии
2001 Эдвин М. Кнорр преподаватель Университет Британской Колумбии
2002 Падрайк Смит профессор Калифорнийский университет в Ирвайне
заместитель директора Центра машинного обучения и интеллектуальных систем
2002 Дарья Чудова вице-президент по биоинформатике Guardant Health
2003 Ева Тардош декан, профессор Корнеллский университет
2003, 2005 Джон Кляйнберг профессор Корнеллский университет
член Национальная академия наук США
Национальная инженерная академия США
Американская академия искусств и наук
2003 Дэвид Кемпе доцент Университет Южной Калифорнии
2004 Рэймонд Дж. Муни профессор Техасский университет в Остине
2004 Михаил (Миша) Биленко руководитель ИИ и исследований Яндекс
2004 Сугуто Басу ведущий научный сотрудник Google
2004, 2005 Кристос Фалуцос профессор Университет Карнеги — Меллона
член ACM
2005 Юре Лесковец доцент Стэнфордский университет
главный научный сотрудник Pinterest
член совета директоров ACM SIGKDD
2006 Торстен Йоахимс заведующий кафедрой, профессор Корнеллский университет
член ACM, AAAI, Humboldt
2007 Сруджана Меругу ведущий дата-сайентист Flipkart
2007 Дипак Агарвал вице-президент по инженерии LinkedIn
член Американская статистическая ассоциация
член совета директоров ACM SIGKDD
2008 Вэй Ван заведующий кафедрой, профессор Калифорнийский университет в Лос-Анджелесе
директор Институт масштабируемой аналитики
2008 Фэй Чжоу профессор Университет Флориды
2008 Сян Чжан доцент Университет штата Пенсильвания
2009 Йехуда Корен научный сотрудник Google
2010 Карлос Гестрин директор по машинному обучению Apple
профессор Университет Вашингтона
сооснователь, CEO Turi (бывш. Dato, GraphLab)
2010 Дафна Шахаф доцент Еврейский университет в Иерусалиме
2010 Кай-Вэй Чанг доцент Калифорнийский университет в Лос-Анджелесе
2010 Чо-Джи Хсие доцент Калифорнийский университет в Дэвисе
2010 Сян-Фу Юй научный сотрудник Amazon
2010 Чих-Джэнь Линь заслуженный профессор Национальный университет Тайваня
член ACM, AAAI, IEEE
2011 Клаудия Перлих главный научный сотрудник Dstillery
приглашённый профессор Нью-Йоркский университет
2011 Сахарон Росет доцент Тель-авивский университет
2011 Шахар Кауфман старший дата-сайентист Metromile
2012 Танауин Рактанманон доцент Университет Касетсарт, Таиланд
2012 Билсон Кампана ведущий инженер-программист Google
2012 Абдулла Муин доцент Университет Нью-Мексико
2012 Густаво Батиста доцент Университет Сан-Паулу
2012 Брэндон Вестовер Massachusetts General Hospital
2012 Цянь Чжу менеджер по анализу данных Airbnb
2012 Джесин Закарайя инженер-программист Microsoft
2012 Эймон Кио профессор Калифорнийский университет в Риверсайде
2013 Эдо Либерти ведущий научный сотрудник Amazon
руководитель группы алгоритмов Amazon AI
2014 Алекс Смола директор по машинному обучению Amazon
профессор Университет Карнеги — Меллона
2014 Суджит Рави ведущий научный сотрудник Google
2014 Амр Ахмед ведущий научный сотрудник Google
2014 Аарон Ли основатель Qokka.ai
(бывш.) руководитель по выводу Scaled Inference

Лучшая студенческая работа

Награда за лучшую студенческую работу отличается от главного приза тем, что её могут получить только работы под авторством студентов (студент в качестве первого автора), представленные на ежегодной конференции SIGKDD[14]

KDD Cup

SIGKDD ежегодно проводит соревнование по анализу данных KDD Cup[18]. параллельно с конференцией. В нём участвуют представители академии и индустрии, в особенности — студенты, интересующиеся интеллектуальным анализом данных.

SIGKDD Explorations

SIGKDD выпускает с 1999 года научный журнал SIGKDD Explorations[19][20], главным редактором которого был основатель ACM SIGKDD Уссама Файяд. Главные редакторы:

  • Чару Агарвал (с 2014)
  • Барт Гёталс (2010—2013)
  • Осмар Р. Зайане (2008—2010)
  • Рамакришнан Шрикант[21] (2006—2007)
  • Сунита Сараваги (2003—2006)
  • Усама Файяд (основатель, 1999—2002)

Люди

Первый состав совета директоров SIGKDD в 1998 году:

  • Вон Ким, президент Cyber Database Solutions, председатель SIGKDD
  • Ракеш Агравал, IBM Almaden, секретарь/казначей SIGKDD
  • Усама Файяд, Microsoft Research, директор SIGKDD и главный редактор бюллетеня SIGKDD Explorations
  • Григорий Пяточный-Шапиро, Knowledge Stream Partners, директор SIGKDD
  • Дэрил Прегибон, AT&T Labs, директор SIGKDD
  • Падрайк Смит, Калифорнийский университет в Ирвайне, директор SIGKDD

Действующий председатель:

  • Бинг Лю (2013-)

Бывшие председатели:

  • Усама Файяд (2009—2013)
  • Григорий Пяточный-Шапиро (2005—2009)
  • Вон Ким (1998—2005)

Бывший исполнительный комитет (2009—2013)

  • Йоханнес Герке
  • Роберт Гроссман
  • Дэвид Дженсен
  • Рагху Рамакришнан
  • Сунита Сараваги
  • Рамакришнан Шрикант

Ответственные за информационные ресурсы:

  • Анкур Тередесаи (2011-)
  • Габор Мелли (2004—2011)
  • Рамакришнан Шрикант (1998—2003)

Примечания

Ссылки