SAS (программное обеспечение)

SAS — программный пакет для статистического анализа, ранее известный как «Statistical Analysis System» (система статистического анализа)[1], разработанный компанией SAS Institute. Программное обеспечение используется для управления данными, продвинутой аналитики, многомерного анализа, бизнес-аналитики, криминалистических исследований[2] и предиктивной аналитики.

Разработка SAS началась в Университете штата Северная Каролина в 1966 году и продолжалась вплоть до 1976 года, когда был создан SAS Institute. В 1980—1990-х годах SAS развивался, расширяя число статистических процедур и добавляя новые компоненты, в том числе JMP. В версии 9, выпущенной в 2004 году, появилась интерфейс point-and-click, упростивший работу для нетехнических пользователей. В 2010 году к продуктовой линейке SAS был добавлен продукт для анализа социальных сетей.

Общие сведения
SAS
Тип аналитический пакет
Автор SAS Institute
Разработчик SAS Institute
Написана на C
Операционные системы Windows, IBM, Unix/Linux, OpenVMS Alpha
Первый выпуск 1972
Последняя версия 9.4M8 (31 января 2023)
Лицензия проприетарная
Сайт sas.com/en_us/home.html

Техническое описание и терминология

SAS представляет собой программный пакет, позволяющий извлекать, изменять, управлять и получать данные из различных источников, а также выполнять статистические анализы этих данных[3]. Кроме того, SAS предоставляет графический пользовательский интерфейс point-and-click для нетехнических специалистов и может использоваться через язык программирования SAS[3].

Программы SAS состоят из этапов DATA (обработка и манипуляция данными) и PROC (анализ данных)[4]. Каждый этап состоит из набора операторов[5].

Этап DATA состоит из выполняемых операторов, реализующих действия, и декларативных операторов, дающих инструкции по чтению и организации набора данных[4]. DATA-процесс делится на стадию компиляции и выполнения. На стадии компиляции обрабатываются декларативные операторы и выявляются синтаксические ошибки; затем на стадии выполнения каждый оператор исполняется последовательно[6]. Наборы данных организованы в виде таблиц, где строки называются «наблюдениями», а столбцы — «переменными». Каждый элемент данных имеет дескриптор и связанное значение[4][7].

Этап PROC включает операторы PROC для вызова конкретных процедур, которые выполняют анализы и формируют отчёты, вычисляют статистику, строят графики и отчёты. SAS предусматривает более 300 именованных процедур, каждая из которых реализует большое количество алгоритмов и статистических функций[4]. Операторы PROC могут также использоваться для сортировки, вывода результатов и прочих операций[5].

Макросы в SAS — это участки кода или переменные, предназначенные для многократного использования и автоматизации повторяющихся операций[8].

Данные в SAS могут публиковаться в различных форматах: HTML, PDF, Excel, RTF и других, с помощью Output Delivery System (ODS), впервые представленной в 2007 году[9]. SAS Enterprise Guide — графический интерфейс пользователя, предоставляющий интуитивную работу с помощью point-and-click и автоматически генерирующий необходимый код для манипуляций и анализа данных[10].

Пакет SAS содержит более 200[11] компонентов[12][13]. Некоторые из ключевых компонентов SAS[3][12]:

  • Base SAS — базовые процедуры и управление данными;
  • SAS/STAT — статистический анализ;
  • SAS/GRAPH — графика и визуализация;
  • SAS/OR — операционные исследования;
  • SAS/ETS — Эконометрика и анализ временных рядов;
  • SAS/IML — матричный язык;
  • SAS/AF — разработки приложений;
  • SAS/QC — управление качеством;
  • SAS/INSIGHT — интеллектуальный анализ данных;
  • SAS/PH — анализ клинических испытаний;
  • Enterprise Miner — интеллектуальный анализ данных;
  • Enterprise Guide — редактор кода на графическом интерфейсе и управление проектами;
  • SAS EBI — инструменты бизнес-аналитики;
  • SAS Grid Manager — управление grid-окружением;
  • SAS CI360 — клиентская аналитика.

История

Происхождение

Работы над SAS начались в 1966 году, когда Университет штата Северная Каролина вновь пригласил Энтони Барра для адаптации его программ анализа дисперсии и регрессии под IBM System/360[14]. Проект финансировался Национальными институтами здравоохранения[15] для анализа аграрных данных с целью повышения урожайности[12][16][17]. К Барру присоединился студент Джеймс Гуднайт, разработавший статистические процедуры, и оба стали руководителями проекта[14]. В 1968 году ими были добавлены новые процедуры для множественной регрессии и дисперсионного анализа[18]. В 1972 году появилась первая версия SAS, но из-за смены приоритетов NIH проект лишился финансирования[15] и продолжился на других грантах. Ключевые разработчики — Джон Салл, Кэрролл Перкинс, Джолейн Сервис, Джейн Хелвиг.

Первые версии SAS назывались по году выпуска[19]. Первая ограниченная версия SAS 71 вышла в 1971 году и работала на мейнфреймах IBM[3][20]. В 1972 году вышла полная версия SAS 72. В 1976 году ключевые разработчики основали SAS Institute и вывели проект за пределы университета.

Развитие

В SAS 76 архитектура была полностью переработана и открыта для внешних компиляторов и процедур. Улучшились операторы INPUT и INFILE, появилась поддержка большинства форматов данных IBM мейнфреймов, реализована генерация отчётов, анализ обобщённых линейных моделей[21] и оператор FORMAT. В SAS 79 появилась поддержка CMS и процедура DATASETS; в SAS 82 — первый макроязык, процедура APPEND[19].

SAS 4 имела ограниченные возможности, однако именно пятая версия ввела полноценный макроязык, подматрицы и интерфейс полного экрана (Display Manager). В 1985 году исходный код был переписан на C, что позволило поддерживать UNIX, MS-DOS и Windows, а ранее использовались PL/1, Fortran и ассемблер[22].

В 1980—1990-х SAS получил множество новых компонентов (SAS/GRAPH, SAS/ETS, SAS/PH-Clinical и др.); в 2002 году SAS/PH-Clinical был утверждён FDA для регистрации новых препаратов. JMP разрабатывался как отдельное приложение под Macintosh (1989), позже появилось много обновлений[23].

SAS 6, использовавшаяся весь 1990-е, поддерживала широкий спектр ОС, в том числе Macintosh, OS/2, Silicon Graphics и др. В версиях 6.06-6.09 появилась Windows-подобная графическая оболочка и поддержка SQL[24]. Версия 7 — модернизированный ODS и улучшенный текстовый редактор. Со временем поддержка сузилась до UNIX, Windows, z/OS; в список добавился Linux[25].

Новейшая история

В 2002 году вышел модуль Text Miner для анализа текстовых данных и бизнес-аналитики. В 2004 году появилась версия 9.0 («Проект Меркурий»), новый интерфейс и функции для бизнес-пользователей[26]; графическая оболочка SAS Enterprise Guide была принята в качестве главного GUI[27].

В 2010-м SAS представил бесплатную студенческую версию[28] и инструменты для анализа социальных сетей; вышел SAS Rapid Predictive Modeler для анализа в Microsoft Excel. Пакет JMP получил интеграцию с языком R и Excel.

В 2015 году были анонсированы новые решения для разных отраслей и новый образовательный софт[29].

Судебные разбирательства SAS Institute Inc. против World Programming Ltd привели в 2012 году к решению Европейского суда: функциональность ПО и язык программирования не подпадают под авторское право[30].

Даты версий

SAS выпускается с 1972 года; с версии 9.3 модуль SAS/STAT имеет свою отдельную нумерацию версий[31].

История версий
Версия Дата Ключевые изменения
72 январь 1972
76 июль 1976
79.5 апрель 1981
82.4 январь 1983
4.06 март 1984
5.03 январь 1985
6.01 июль 1986 PC DOS
6.03 март 1988
6.06 март 1990
6.07 апрель 1991
6.08 март 1993
6.09 октябрь 1993
6.10 октябрь 1994
6.11 октябрь 1995
6.12 ноябрь 1996
7.0 октябрь 1998
8.0 ноябрь 1999
8.1 июль 2000
8.2 март 2001
9.0 октябрь 2002
9.1 декабрь 2003
9.1.3 август 2004
9.2 март 2008 STAT 9.2
9.2M2 апрель 2010 STAT 9.22
9.3 июль 2011 STAT 9.3
9.3M2 август 2012 STAT 12.1
9.4 июль 2013 STAT 12.3
9.4M1 декабрь 2013 STAT 13.1
9.4M2 август 2014 STAT 13.2
9.4M3 июль 2015 STAT 14.1
9.4M4 ноябрь 2016 STAT 14.2
9.4M5 сентябрь 2017 STAT 14.3
9.4M6 ноябрь 2018 STAT 15.1
9.4M7 август 2020 STAT 15.2
9.4M8 январь 2023 STAT 15.3

Продукты

С 2011 года крупнейшим направлением SAS стала аналитика клиентов, включающая модули для веб-аналитики, анализа соцсетей и маркетинговых задач, построения клиентских профилей, прогнозирования поведения и управления коммуникациями[32]. Платформа SAS Fraud Framework предназначена для мониторинга транзакций, поиска аномалий, выявления мошенничества[33]. SAS Enterprise GRC реализует моделирование рисков и анализ комплаенса. Для сферы финансов SAS предлагает комплекс SAS Enterprise Risk Management[34].

Продукты SAS для управления ИТ (SAS IT Management Solutions) агрегируют и анализируют данные о работе инфраструктуры[35], формируют специализированные отчёты и графическую визуализацию KPI. Предлагаются отраслевые сборки (госуправление, ритейл, телеком, авиапромышленность) и решения для оптимизации маркетинга, цепочек поставок, управления устойчивым развитием.

Бесплатная университетская редакция

Ранее SAS предлагала бесплатную университетскую редакцию для некоммерческого использования. Первый анонс этой редакции датируется 28 мая 2014 года[36]. В 2022 году бесплатная редакция была заменена облачными версиями SAS OnDemand for Academics и SAS Viya for Learners[37].

Сравнение с конкурентами

По сравнению с такими пакетами, как Stata и SPSS, SAS обладает широчайшими возможностями анализа и управления данными, но считается сложным для изучения и освоения[38]. SPSS и Stata легче осваивать благодаря лучшей документации, хотя их функциональность может быть расширена через плагины. Для начинающих рекомендованы SPSS и Stata, а SAS — для более продвинутых пользователей. Аналогичные сравнения проводила Калифорнийский университет в Лос-Анджелесе[39]. Бизнес-модель SAS основана преимущественно на ежегодных подписках[40].

SAS Viya

В 2016 году представлена архитектура SAS Viya[41] для использования в облаке и поддержки моделей, построенных в R, Python, Jupyter, с последующим исполнением в SAS Cloud Analytics Services (CAS)[42]. В 2020 году представлен существенный архитектурный редизайн Viya 4[43]. Viya поставляется одновременно с SAS 9.4, но не объявлен его заменой[44].

Распространённость

Согласно данным IDC, в 2013 году SAS занимал 35,4 % мирового рынка «продвинутой аналитики»[45] и был пятым в мире среди поставщиков BI с долей 6,9 %[46]. В этом рынке SAS конкурирует с SAP BusinessObjects, IBM Cognos, SPSS Modeler, Oracle Hyperion и Microsoft Power BI[47]. Решения SAS признаны в квадрантах лидеров Gartner в сфере аналитических платформ.

В исследовании BMC Health Services Research 42,6 % работ в области анализа данных в здравоохранении выполнялись с помощью SAS[48].

Примечания

  1. About SAS (англ.). Дата обращения: 5 июля 2017. Архивировано 6 октября 2025 года.
  2. SAS empowers crime fighters to crack complex cases (англ.) (9 апреля 2018). Дата обращения: 6 июля 2021. Архивировано 9 июля 2021 года.
  3. 1 2 3 4 Salkind, Neil. Encyclopedia of Research Design : [англ.]. — 2010. — ISBN 9781412961271. — doi:10.4135/9781412961288.
  4. 1 2 3 4 SAS Institute Inc. и World Programming Limited (Высокий суд Англии и Уэльса, 23 июля 2010). Архивировано 23 сентября 2015 года.
  5. 1 2 Delwiche, Lora D. The Little SAS Book: A Primer: a Programming Approach : [англ.] / Lora D. Delwiche, Susan J. Slaughter. — SAS Institute, 2012. — P. 6. — ISBN 978-1-61290-400-9.
  6. Li, Arthur. Handbook of SAS DATA Step Programming : [англ.]. — CRC Press, 2013-04-10. — P. 149. — ISBN 978-1-4665-5238-8.
  7. Buck, Debbie A Hands-On Introduction to SAS DATA Step Programming (англ.). SAS Institute. Дата обращения: 2 октября 2013. Архивировано 11 ноября 2005 года.
  8. Jyoti Bass, N. Base Sas Programming Black Book, 2007 Ed : [англ.] / N. Jyoti Bass, K. Madhavi Lata. — Dreamtech Press, 2007-09-01. — P. 365. — ISBN 978-81-7722-769-7.
  9. Tolbert, William (2010-12-01). “How to Win Friends and Influence People with the SAS Output Delivery System”. Clinical Medicine & Research [англ.]. 8: 189—190. DOI:10.3121/cmr.2010.943.c-c1-04. PMID 3006529.
  10. Der, Geoff; Everitt, Brian S. (2009-03-10). “Basic Statistics using SAS Enterprise Guide”. Journal of the Royal Statistical Society, Series A [англ.]. 172: 530. DOI:10.1111/j.1467-985X.2009.00588_2.x.
  11. Schermerhorn, John R. Exploring Management : [англ.] / John Wiley & Sons. — 2011-10-11. — P. 3. — ISBN 978-0-470-87821-7.
  12. 1 2 3 Spector, Phil Университет Калифорнии, Беркли: An Introduction to the SAS System (англ.). stat.berkeley.edu. Дата обращения: 4 октября 2013. Архивировано 12 октября 2013 года.
  13. Chapman, David Determine what SAS Version and Components are available (англ.). NESUG (2012). Дата обращения: 13 июля 2023. Архивировано 8 апреля 2018 года.
  14. 1 2 Nourse, E. Shepley; Greenberg, Bernard G.; Cox, Gertrude M.; Mason, David D.; Grizzle, James E.; Johnson, Norman L.; Jones, Lyle V.; Monroe, John; Simons, Gordon D. (1978). “Statistical Training and Research: The University of North Carolina System”. International Statistical Review / Revue Internationale de Statistique [англ.]. 46: 171. DOI:10.2307/1402812. ISSN 0306-7734.
  15. 1 2 SAS Institute FDA Intellectual Partnership for Efficient Regulated Research Data Archival and Analysis (англ.). Доклад в Duke University (12 апреля 2000). Дата обращения: 28 сентября 2011. Архивировано 24 августа 2000 года.
  16. Dalesio, Emery. Little-known software giant to raise its profile (англ.) (5 May 2001). Дата обращения: 8 апреля 2014.
  17. Kaplan, David. SAS: A new no. 1 best employer (англ.) (22 January 2010). Архивировано 29 ноября 2011 года. Дата обращения: 8 апреля 2014.
  18. Barr, Anthony; Goodnight, James (1976). “The SAS Staff” [англ.]. SAS 72 and SAS 76 are attributed to Barr, Goodnight, Service, Perkins, and Helwig
  19. 1 2 Aster, Rick History of SAS version (англ.). Global Statements. Дата обращения: 4 октября 2013. Архивировано 19 апреля 2025 года.
  20. Barr, Anthony. Statistical analysis system : [англ.] / Anthony Barr, James Goodnight, James Howard. — North Carolina State University, 1971.
  21. Barr, Anthony. SAS Programmer's Guide : [англ.] / Anthony Barr, James Goodnight, John Sall … [et al.]. — SAS Institute, Inc., 1979.
  22. SAS corporate timeline (англ.) (3 March 2011). Архивировано 31 июля 2013 года. Дата обращения: 17 октября 2011.
  23. Cox, Ian. Visual Six Sigma: Making Data Analysis Lean : [англ.] / Ian Cox, Marie A. Gaudard, Philip J. Ramsey … [et al.]. — John Wiley & Sons, 2009. — P. 23. — ISBN 978-0-470-50691-2.
  24. Lafler, Kirk Paul. PROC SQL: Beyond the Basics Using SAS, Second Edition : [англ.]. — SAS Institute, 2013. — ISBN 978-1-61290-027-8.
  25. Supported Operating Systems (англ.). SAS Institute. Дата обращения: 6 октября 2012. Архивировано 23 июля 2025 года.
  26. Steven, Dave. SAS is Starting to Look Even Better... (англ.) (29 July 2002). Архивировано 15 апреля 2012 года. Дата обращения: 17 октября 2011.
  27. Whiting, Rick. SAS Extends Business Intelligence to the Masses (англ.) (31 March 2004). Архивировано 3 мая 2012 года. Дата обращения: 17 октября 2011.
  28. Hardy, Quentin. SAS-We Spurned IBM, Now to Win (англ.) (9 June 2011). Архивировано 30 ноября 2024 года. Дата обращения: 17 октября 2011.
  29. Jackson, Joab. SAS enlarges its palette for big data analysis (англ.) (27 April 2015). Архивировано 28 ноября 2018 года. Дата обращения: 22 мая 2015.
  30. The functionality of a computer program and the programming language cannot be protected by copyright (англ.). European Court of Justice. Дата обращения: 19 мая 2012. Архивировано 27 августа 2025 года.
  31. How old is your version of SAS? Release dates for SAS software (англ.). Архивировано 19 апреля 2023 года. Дата обращения: 26 апреля 2023.
  32. Whiting, Rick. SAS Ships Customer-Intelligence App (англ.) (11 May 2004). Архивировано 12 января 2014 года. Дата обращения: 7 января 2014.
  33. Yasin, Rutrell. Social network analysis, predictive coding enlisted to fight fraud (англ.) (10 May 2013). Архивировано 27 ноября 2018 года. Дата обращения: 11 декабря 2013.
  34. Iraq Telecom Monthly Newsletter November 2009 : [англ.] / Information Gatekeepers Inc ; Hui Pan. — P. 5.
  35. SAS Launches Suite Of Solutions For IT (англ.) (22 September 2004). Архивировано 15 апреля 2012 года. Дата обращения: 12 декабря 2013.
  36. Free SAS® Software for Higher Education, Adult Learners Now Available (англ.). businesswire (28 мая 2014). Дата обращения: 6 января 2019. Архивировано 25 февраля 2024 года.
  37. SAS Academic Software (англ.). SAS. Дата обращения: 19 октября 2022. Архивировано 19 августа 2025 года.
  38. Acock, Alan C. (2005-11). “SAS, Stata, SPSS: A Comparison”. Journal of Marriage and Family [англ.]. 67: 1093—1095. DOI:10.1111/j.1741-3737.2005.00196.x. Проверьте дату в |date= (справка на английском)
  39. Compare Packages (англ.). University of California, Los Angeles. Дата обращения: 12 января 2014. Архивировано 12 января 2014 года.
  40. Ranii, David. SAS' revenue up 12% in 2011 (англ.) (20 January 2012). Архивировано 7 сентября 2014 года. Дата обращения: 12 января 2014.
  41. Henschen, Doug SAS goes cloud but will customers follow? (англ.). ZDnet. Дата обращения: 16 июня 2023. Архивировано 28 апреля 2016 года.
  42. Baer, Tony SAS is on the brink of generation change (англ.). ZDnet. Дата обращения: 16 июня 2023. Архивировано 6 октября 2025 года.
  43. Avidon, Eric SAS Viya gets architectural overhaul in latest update (англ.). TechTarget. Дата обращения: 16 июня 2023. Архивировано 6 октября 2025 года.
  44. Relationship between SAS 9.4 and SAS Viya (англ.). SAS Help Center. Дата обращения: 16 июня 2023. Архивировано 28 октября 2023 года.
  45. Just How Big Is the Big Data Market? (англ.). ClickZ (7 июля 2014). Дата обращения: 7 июля 2014. Архивировано 25 октября 2015 года.
  46. Vesset, Dan Worldwide Business Analytics Software 2013–2017 Forecast and 2012 Vendor Shares (англ.). IDC. Дата обращения: 2 октября 2013. Архивировано 16 апреля 2025 года.
  47. Pendse, Nigel Consolidations in the BI industry (англ.). The OLAP Report (7 марта 2008). Дата обращения: 13 июля 2023. Архивировано 10 июля 2013 года.
  48. Dembe, A. E.; Partridge, J. S.; Geist, L. C. (2011). “Statistical software applications used in health services research: Analysis of published studies in the U.S”. BMC Health Services Research [англ.]. 11: 252. DOI:10.1186/1472-6963-11-252. PMC 3205033. PMID 21977990.

Ссылки