Конференция по извлечению знаний и анализу данных
Конференция по извлечению знаний и анализу данных (англ. Knowledge Discovery and Data Mining Conference, KDD) — ежегодная международная конференция, организуемая Специальной группой интересов по извлечению знаний и анализу данных (SIGKDD) Ассоциации вычислительной техники (англ. Association for Computing Machinery, ACM). Является одной из самых влиятельных научных площадок в области интеллектуального анализа данных и поиска закономерностей в больших наборах данных[1].
История конференции
Конференция KDD выросла из серии воркшопов по извлечению знаний и анализу данных, проходивших в рамках конференций по искусственному интеллекту AAAI начиная с 1989 года под руководством Григория Пяточного-Шапиро и Усамы Файяда[2]. С 1995 года конференция проводится ежегодно; Специальная группа интересов SIGKDD официально была создана в составе ACM в 1998 году[3]. Все доклады публикуются через ACM[4].
KDD признана ведущим форумом для публикации результатов исследований по интеллектуальному анализу данных[5]. По данным анализа Лексин Си за 1994—2015 годы на конференции было опубликовано 4489 работ, получивших в сумме 112 570 цитирований в 3033 изданиях, более половины которых относятся к топ-25 научных журналов в этой области[6].
Конференция SIGKDD ежегодно отмечается как флагманское событие в области анализа данных, входящее в высший рейтинг A* организации Computing Research and Education (CORE)[7].
| Год | Место проведения конференции |
|---|---|
| 2011 | Сан-Диего, США |
| 2012 | Пекин, Китай |
| 2013 | Чикаго, США |
| 2014 | Нью-Йорк, США |
| 2015 | Сидней, Австралия |
| 2016 | Сан-Франциско, США |
| 2017 | Галифакс, Канада |
| 2018 | Лондон, Великобритания |
| 2019 | Анкоридж, США |
| 2020 | Сан-Диего, США |
| 2021 | Виртуальная конференция |
| 2022 | Вашингтон, округ Колумбия, США |
| 2023 | Лонг-Бич, США |
| 2024[8] | Барселона, Испания |
| 2025 | Торонто, Канада |
Как и другие ведущие конференции, SIGKDD предъявляет высокие требования к качеству публикаций, отдавая предпочтение инновационным исследованиям в анализе данных, извлечении знаний, масштабной аналитике. Предпочтение отдаётся работам с серьёзной теоретической базой, оригинальным моделям и подходам в научных, бизнес-, медицинских и инженерных задачах. Инкрементальные или мало значимые работы принимаются крайне редко[9].
В 2014 году конференция получила более 1000 заявок от более чем 2600 авторов из не менее четырнадцати стран; к публикации было принято всего 151 доклад, то есть уровень принятия составил 14,6 %. Этот показатель ниже, чем у большинства топовых конференций по информатике (15-25 %), что свидетельствует о высокой конкуренции и значимости площадки[10][11]. Однако, низкий процент приёма является лишь косвенным признаком качества — более высокая конкуренция не всегда означает более сильный вклад[12].
Награды
SIGKDD ежегодно вручает премии за инновации и за вклад в сообщество KDD[13]. Кроме того, вручаются награды за лучшую работу и лучшую студенческую работу конференции[14][15].
Получение награды SIGKDD за лучшую исследовательскую работу считается значительным международным признанием в академической и индустриальной карьере исследователя[16][17]. Награда вручается авторам работ, внёсших наибольший вклад в развитие фундаментальных идей в области извлечения знаний из данных.
Кандидаты проходят многоуровневое экспертное рецензирование по строгим критериям; членами жюри выступают признанные специалисты, не связанные с авторами работ. Оцениваются новизна, техническое качество, значимость результатов, чёткость изложения, прозрачность и воспроизводимость экспериментов[9]. Финалисты определяются на основании максимального продвижения области, показанного в работе.
Премия SIGKDD за лучшую исследовательскую работу вручалась с 1997 года следующим лицам:
| Год | Имя | Должность | Организация |
|---|---|---|---|
| 1997 | Фостер Провост | профессор | Нью-Йоркский университет |
| 1997 | Том Фосетт | ведущий дата-сайентист | Silicon Valley Data Science |
| 1998, 1999 | Педро Домингос | профессор | Университет Вашингтона |
| 2000 | Энн Роджерс | доцент | Чикагский университет |
| 2000 | Дэрил Прегибон | (бывш.) глава отдела статистики | AT&T Labs и Bell Labs |
| 2000 | Кэтлин Фишер | заведующая кафедрой, профессор | Университет Тафтса |
| 2000 | Коринна Кортес | руководитель исследований | |
| 2001 | Рубен Х. Замар | профессор | Университет Британской Колумбии |
| 2001 | Рэймонд Нг | профессор | Университет Британской Колумбии |
| 2001 | Эдвин М. Кнорр | преподаватель | Университет Британской Колумбии |
| 2002 | Падрайк Смит | профессор | Калифорнийский университет в Ирвайне |
| заместитель директора | Центра машинного обучения и интеллектуальных систем | ||
| 2002 | Дарья Чудова | вице-президент по биоинформатике | Guardant Health |
| 2003 | Ева Тардош | декан, профессор | Корнеллский университет |
| 2003, 2005 | Джон Кляйнберг | профессор | Корнеллский университет |
| член | Национальная академия наук США | ||
| Национальная инженерная академия США | |||
| Американская академия искусств и наук | |||
| 2003 | Дэвид Кемпе | доцент | Университет Южной Калифорнии |
| 2004 | Рэймонд Дж. Муни | профессор | Техасский университет в Остине |
| 2004 | Михаил (Миша) Биленко | руководитель ИИ и исследований | Яндекс |
| 2004 | Сугуто Басу | ведущий научный сотрудник | |
| 2004, 2005 | Кристос Фалуцос | профессор | Университет Карнеги — Меллона |
| член | ACM | ||
| 2005 | Юре Лесковец | доцент | Стэнфордский университет |
| главный научный сотрудник | |||
| член совета директоров | ACM SIGKDD | ||
| 2006 | Торстен Йоахимс | заведующий кафедрой, профессор | Корнеллский университет |
| член | ACM, AAAI, Humboldt | ||
| 2007 | Сруджана Меругу | ведущий дата-сайентист | Flipkart |
| 2007 | Дипак Агарвал | вице-президент по инженерии | |
| член | Американская статистическая ассоциация | ||
| член совета директоров | ACM SIGKDD | ||
| 2008 | Вэй Ван | заведующий кафедрой, профессор | Калифорнийский университет в Лос-Анджелесе |
| директор | Институт масштабируемой аналитики | ||
| 2008 | Фэй Чжоу | профессор | Университет Флориды |
| 2008 | Сян Чжан | доцент | Университет штата Пенсильвания |
| 2009 | Йехуда Корен | научный сотрудник | |
| 2010 | Карлос Гестрин | директор по машинному обучению | Apple |
| профессор | Университет Вашингтона | ||
| сооснователь, CEO | Turi (бывш. Dato, GraphLab) | ||
| 2010 | Дафна Шахаф | доцент | Еврейский университет в Иерусалиме |
| 2010 | Кай-Вэй Чанг | доцент | Калифорнийский университет в Лос-Анджелесе |
| 2010 | Чо-Джи Хсие | доцент | Калифорнийский университет в Дэвисе |
| 2010 | Сян-Фу Юй | научный сотрудник | Amazon |
| 2010 | Чих-Джэнь Линь | заслуженный профессор | Национальный университет Тайваня |
| член | ACM, AAAI, IEEE | ||
| 2011 | Клаудия Перлих | главный научный сотрудник | Dstillery |
| приглашённый профессор | Нью-Йоркский университет | ||
| 2011 | Сахарон Росет | доцент | Тель-авивский университет |
| 2011 | Шахар Кауфман | старший дата-сайентист | Metromile |
| 2012 | Танауин Рактанманон | доцент | Университет Касетсарт, Таиланд |
| 2012 | Билсон Кампана | ведущий инженер-программист | |
| 2012 | Абдулла Муин | доцент | Университет Нью-Мексико |
| 2012 | Густаво Батиста | доцент | Университет Сан-Паулу |
| 2012 | Брэндон Вестовер | Massachusetts General Hospital | |
| 2012 | Цянь Чжу | менеджер по анализу данных | Airbnb |
| 2012 | Джесин Закарайя | инженер-программист | Microsoft |
| 2012 | Эймон Кио | профессор | Калифорнийский университет в Риверсайде |
| 2013 | Эдо Либерти | ведущий научный сотрудник | Amazon |
| руководитель группы алгоритмов | Amazon AI | ||
| 2014 | Алекс Смола | директор по машинному обучению | Amazon |
| профессор | Университет Карнеги — Меллона | ||
| 2014 | Суджит Рави | ведущий научный сотрудник | |
| 2014 | Амр Ахмед | ведущий научный сотрудник | |
| 2014 | Аарон Ли | основатель | Qokka.ai |
| (бывш.) руководитель по выводу | Scaled Inference |
Награда за лучшую студенческую работу отличается от главного приза тем, что её могут получить только работы под авторством студентов (студент в качестве первого автора), представленные на ежегодной конференции SIGKDD[14]
KDD Cup
SIGKDD ежегодно проводит соревнование по анализу данных KDD Cup[18]. параллельно с конференцией. В нём участвуют представители академии и индустрии, в особенности — студенты, интересующиеся интеллектуальным анализом данных.
SIGKDD Explorations
SIGKDD выпускает с 1999 года научный журнал SIGKDD Explorations[19][20], главным редактором которого был основатель ACM SIGKDD Уссама Файяд. Главные редакторы:
- Чару Агарвал (с 2014)
- Барт Гёталс (2010—2013)
- Осмар Р. Зайане (2008—2010)
- Рамакришнан Шрикант[21] (2006—2007)
- Сунита Сараваги (2003—2006)
- Усама Файяд (основатель, 1999—2002)
Люди
Первый состав совета директоров SIGKDD в 1998 году:
- Вон Ким, президент Cyber Database Solutions, председатель SIGKDD
- Ракеш Агравал, IBM Almaden, секретарь/казначей SIGKDD
- Усама Файяд, Microsoft Research, директор SIGKDD и главный редактор бюллетеня SIGKDD Explorations
- Григорий Пяточный-Шапиро, Knowledge Stream Partners, директор SIGKDD
- Дэрил Прегибон, AT&T Labs, директор SIGKDD
- Падрайк Смит, Калифорнийский университет в Ирвайне, директор SIGKDD
Действующий председатель:
- Бинг Лю (2013-)
Бывшие председатели:
- Усама Файяд (2009—2013)
- Григорий Пяточный-Шапиро (2005—2009)
- Вон Ким (1998—2005)
Бывший исполнительный комитет (2009—2013)
- Йоханнес Герке
- Роберт Гроссман
- Дэвид Дженсен
- Рагху Рамакришнан
- Сунита Сараваги
- Рамакришнан Шрикант
Ответственные за информационные ресурсы:
- Анкур Тередесаи (2011-)
- Габор Мелли (2004—2011)
- Рамакришнан Шрикант (1998—2003)
Примечания
Ссылки
- Официальный сайт конференции KDD. www.kdd.org. Дата обращения: 29 июня 2024.
- ACM SIGKDD Explorations