SAS (программное обеспечение)
SAS — программный пакет для статистического анализа, ранее известный как «Statistical Analysis System» (система статистического анализа)[1], разработанный компанией SAS Institute. Программное обеспечение используется для управления данными, продвинутой аналитики, многомерного анализа, бизнес-аналитики, криминалистических исследований[2] и предиктивной аналитики.
Разработка SAS началась в Университете штата Северная Каролина в 1966 году и продолжалась вплоть до 1976 года, когда был создан SAS Institute. В 1980—1990-х годах SAS развивался, расширяя число статистических процедур и добавляя новые компоненты, в том числе JMP. В версии 9, выпущенной в 2004 году, появилась интерфейс point-and-click, упростивший работу для нетехнических пользователей. В 2010 году к продуктовой линейке SAS был добавлен продукт для анализа социальных сетей.
Общие сведения
| SAS | |
|---|---|
| Тип | аналитический пакет |
| Автор | SAS Institute |
| Разработчик | SAS Institute |
| Написана на | C |
| Операционные системы | Windows, IBM, Unix/Linux, OpenVMS Alpha |
| Первый выпуск | 1972 |
| Последняя версия | 9.4M8 (31 января 2023) |
| Лицензия | проприетарная |
| Сайт | sas.com/en_us/home.html |
Техническое описание и терминология
SAS представляет собой программный пакет, позволяющий извлекать, изменять, управлять и получать данные из различных источников, а также выполнять статистические анализы этих данных[3]. Кроме того, SAS предоставляет графический пользовательский интерфейс point-and-click для нетехнических специалистов и может использоваться через язык программирования SAS[3].
Программы SAS состоят из этапов DATA (обработка и манипуляция данными) и PROC (анализ данных)[4]. Каждый этап состоит из набора операторов[5].
Этап DATA состоит из выполняемых операторов, реализующих действия, и декларативных операторов, дающих инструкции по чтению и организации набора данных[4]. DATA-процесс делится на стадию компиляции и выполнения. На стадии компиляции обрабатываются декларативные операторы и выявляются синтаксические ошибки; затем на стадии выполнения каждый оператор исполняется последовательно[6]. Наборы данных организованы в виде таблиц, где строки называются «наблюдениями», а столбцы — «переменными». Каждый элемент данных имеет дескриптор и связанное значение[4][7].
Этап PROC включает операторы PROC для вызова конкретных процедур, которые выполняют анализы и формируют отчёты, вычисляют статистику, строят графики и отчёты. SAS предусматривает более 300 именованных процедур, каждая из которых реализует большое количество алгоритмов и статистических функций[4]. Операторы PROC могут также использоваться для сортировки, вывода результатов и прочих операций[5].
Макросы в SAS — это участки кода или переменные, предназначенные для многократного использования и автоматизации повторяющихся операций[8].
Данные в SAS могут публиковаться в различных форматах: HTML, PDF, Excel, RTF и других, с помощью Output Delivery System (ODS), впервые представленной в 2007 году[9]. SAS Enterprise Guide — графический интерфейс пользователя, предоставляющий интуитивную работу с помощью point-and-click и автоматически генерирующий необходимый код для манипуляций и анализа данных[10].
Пакет SAS содержит более 200[11] компонентов[12][13]. Некоторые из ключевых компонентов SAS[3][12]:
- Base SAS — базовые процедуры и управление данными;
- SAS/STAT — статистический анализ;
- SAS/GRAPH — графика и визуализация;
- SAS/OR — операционные исследования;
- SAS/ETS — Эконометрика и анализ временных рядов;
- SAS/IML — матричный язык;
- SAS/AF — разработки приложений;
- SAS/QC — управление качеством;
- SAS/INSIGHT — интеллектуальный анализ данных;
- SAS/PH — анализ клинических испытаний;
- Enterprise Miner — интеллектуальный анализ данных;
- Enterprise Guide — редактор кода на графическом интерфейсе и управление проектами;
- SAS EBI — инструменты бизнес-аналитики;
- SAS Grid Manager — управление grid-окружением;
- SAS CI360 — клиентская аналитика.
История
Работы над SAS начались в 1966 году, когда Университет штата Северная Каролина вновь пригласил Энтони Барра для адаптации его программ анализа дисперсии и регрессии под IBM System/360[14]. Проект финансировался Национальными институтами здравоохранения[15] для анализа аграрных данных с целью повышения урожайности[12][16][17]. К Барру присоединился студент Джеймс Гуднайт, разработавший статистические процедуры, и оба стали руководителями проекта[14]. В 1968 году ими были добавлены новые процедуры для множественной регрессии и дисперсионного анализа[18]. В 1972 году появилась первая версия SAS, но из-за смены приоритетов NIH проект лишился финансирования[15] и продолжился на других грантах. Ключевые разработчики — Джон Салл, Кэрролл Перкинс, Джолейн Сервис, Джейн Хелвиг.
Первые версии SAS назывались по году выпуска[19]. Первая ограниченная версия SAS 71 вышла в 1971 году и работала на мейнфреймах IBM[3][20]. В 1972 году вышла полная версия SAS 72. В 1976 году ключевые разработчики основали SAS Institute и вывели проект за пределы университета.
В SAS 76 архитектура была полностью переработана и открыта для внешних компиляторов и процедур. Улучшились операторы INPUT и INFILE, появилась поддержка большинства форматов данных IBM мейнфреймов, реализована генерация отчётов, анализ обобщённых линейных моделей[21] и оператор FORMAT. В SAS 79 появилась поддержка CMS и процедура DATASETS; в SAS 82 — первый макроязык, процедура APPEND[19].
SAS 4 имела ограниченные возможности, однако именно пятая версия ввела полноценный макроязык, подматрицы и интерфейс полного экрана (Display Manager). В 1985 году исходный код был переписан на C, что позволило поддерживать UNIX, MS-DOS и Windows, а ранее использовались PL/1, Fortran и ассемблер[22].
В 1980—1990-х SAS получил множество новых компонентов (SAS/GRAPH, SAS/ETS, SAS/PH-Clinical и др.); в 2002 году SAS/PH-Clinical был утверждён FDA для регистрации новых препаратов. JMP разрабатывался как отдельное приложение под Macintosh (1989), позже появилось много обновлений[23].
SAS 6, использовавшаяся весь 1990-е, поддерживала широкий спектр ОС, в том числе Macintosh, OS/2, Silicon Graphics и др. В версиях 6.06-6.09 появилась Windows-подобная графическая оболочка и поддержка SQL[24]. Версия 7 — модернизированный ODS и улучшенный текстовый редактор. Со временем поддержка сузилась до UNIX, Windows, z/OS; в список добавился Linux[25].
В 2002 году вышел модуль Text Miner для анализа текстовых данных и бизнес-аналитики. В 2004 году появилась версия 9.0 («Проект Меркурий»), новый интерфейс и функции для бизнес-пользователей[26]; графическая оболочка SAS Enterprise Guide была принята в качестве главного GUI[27].
В 2010-м SAS представил бесплатную студенческую версию[28] и инструменты для анализа социальных сетей; вышел SAS Rapid Predictive Modeler для анализа в Microsoft Excel. Пакет JMP получил интеграцию с языком R и Excel.
В 2015 году были анонсированы новые решения для разных отраслей и новый образовательный софт[29].
Судебные разбирательства SAS Institute Inc. против World Programming Ltd привели в 2012 году к решению Европейского суда: функциональность ПО и язык программирования не подпадают под авторское право[30].
SAS выпускается с 1972 года; с версии 9.3 модуль SAS/STAT имеет свою отдельную нумерацию версий[31].
| Версия | Дата | Ключевые изменения |
|---|---|---|
| 72 | январь 1972 | |
| 76 | июль 1976 | |
| 79.5 | апрель 1981 | |
| 82.4 | январь 1983 | |
| 4.06 | март 1984 | |
| 5.03 | январь 1985 | |
| 6.01 | июль 1986 | PC DOS |
| 6.03 | март 1988 | |
| 6.06 | март 1990 | |
| 6.07 | апрель 1991 | |
| 6.08 | март 1993 | |
| 6.09 | октябрь 1993 | |
| 6.10 | октябрь 1994 | |
| 6.11 | октябрь 1995 | |
| 6.12 | ноябрь 1996 | |
| 7.0 | октябрь 1998 | |
| 8.0 | ноябрь 1999 | |
| 8.1 | июль 2000 | |
| 8.2 | март 2001 | |
| 9.0 | октябрь 2002 | |
| 9.1 | декабрь 2003 | |
| 9.1.3 | август 2004 | |
| 9.2 | март 2008 | STAT 9.2 |
| 9.2M2 | апрель 2010 | STAT 9.22 |
| 9.3 | июль 2011 | STAT 9.3 |
| 9.3M2 | август 2012 | STAT 12.1 |
| 9.4 | июль 2013 | STAT 12.3 |
| 9.4M1 | декабрь 2013 | STAT 13.1 |
| 9.4M2 | август 2014 | STAT 13.2 |
| 9.4M3 | июль 2015 | STAT 14.1 |
| 9.4M4 | ноябрь 2016 | STAT 14.2 |
| 9.4M5 | сентябрь 2017 | STAT 14.3 |
| 9.4M6 | ноябрь 2018 | STAT 15.1 |
| 9.4M7 | август 2020 | STAT 15.2 |
| 9.4M8 | январь 2023 | STAT 15.3 |
Продукты
С 2011 года крупнейшим направлением SAS стала аналитика клиентов, включающая модули для веб-аналитики, анализа соцсетей и маркетинговых задач, построения клиентских профилей, прогнозирования поведения и управления коммуникациями[32]. Платформа SAS Fraud Framework предназначена для мониторинга транзакций, поиска аномалий, выявления мошенничества[33]. SAS Enterprise GRC реализует моделирование рисков и анализ комплаенса. Для сферы финансов SAS предлагает комплекс SAS Enterprise Risk Management[34].
Продукты SAS для управления ИТ (SAS IT Management Solutions) агрегируют и анализируют данные о работе инфраструктуры[35], формируют специализированные отчёты и графическую визуализацию KPI. Предлагаются отраслевые сборки (госуправление, ритейл, телеком, авиапромышленность) и решения для оптимизации маркетинга, цепочек поставок, управления устойчивым развитием.
Ранее SAS предлагала бесплатную университетскую редакцию для некоммерческого использования. Первый анонс этой редакции датируется 28 мая 2014 года[36]. В 2022 году бесплатная редакция была заменена облачными версиями SAS OnDemand for Academics и SAS Viya for Learners[37].
По сравнению с такими пакетами, как Stata и SPSS, SAS обладает широчайшими возможностями анализа и управления данными, но считается сложным для изучения и освоения[38]. SPSS и Stata легче осваивать благодаря лучшей документации, хотя их функциональность может быть расширена через плагины. Для начинающих рекомендованы SPSS и Stata, а SAS — для более продвинутых пользователей. Аналогичные сравнения проводила Калифорнийский университет в Лос-Анджелесе[39]. Бизнес-модель SAS основана преимущественно на ежегодных подписках[40].
В 2016 году представлена архитектура SAS Viya[41] для использования в облаке и поддержки моделей, построенных в R, Python, Jupyter, с последующим исполнением в SAS Cloud Analytics Services (CAS)[42]. В 2020 году представлен существенный архитектурный редизайн Viya 4[43]. Viya поставляется одновременно с SAS 9.4, но не объявлен его заменой[44].
Распространённость
Согласно данным IDC, в 2013 году SAS занимал 35,4 % мирового рынка «продвинутой аналитики»[45] и был пятым в мире среди поставщиков BI с долей 6,9 %[46]. В этом рынке SAS конкурирует с SAP BusinessObjects, IBM Cognos, SPSS Modeler, Oracle Hyperion и Microsoft Power BI[47]. Решения SAS признаны в квадрантах лидеров Gartner в сфере аналитических платформ.
В исследовании BMC Health Services Research 42,6 % работ в области анализа данных в здравоохранении выполнялись с помощью SAS[48].
Примечания
- ↑ About SAS (англ.). Дата обращения: 5 июля 2017. Архивировано 6 октября 2025 года.
- ↑ SAS empowers crime fighters to crack complex cases (англ.) (9 апреля 2018). Дата обращения: 6 июля 2021. Архивировано 9 июля 2021 года.
- ↑ 1 2 3 4 Salkind, Neil. Encyclopedia of Research Design : [англ.]. — 2010. — ISBN 9781412961271. — doi:10.4135/9781412961288.
- ↑ 1 2 3 4 SAS Institute Inc. и World Programming Limited (Высокий суд Англии и Уэльса, 23 июля 2010). Архивировано 23 сентября 2015 года.
- ↑ 1 2 Delwiche, Lora D. The Little SAS Book: A Primer: a Programming Approach : [англ.] / Lora D. Delwiche, Susan J. Slaughter. — SAS Institute, 2012. — P. 6. — ISBN 978-1-61290-400-9.
- ↑ Li, Arthur. Handbook of SAS DATA Step Programming : [англ.]. — CRC Press, 2013-04-10. — P. 149. — ISBN 978-1-4665-5238-8.
- ↑ Buck, Debbie A Hands-On Introduction to SAS DATA Step Programming (англ.). SAS Institute. Дата обращения: 2 октября 2013. Архивировано 11 ноября 2005 года.
- ↑ Jyoti Bass, N. Base Sas Programming Black Book, 2007 Ed : [англ.] / N. Jyoti Bass, K. Madhavi Lata. — Dreamtech Press, 2007-09-01. — P. 365. — ISBN 978-81-7722-769-7.
- ↑ Tolbert, William (2010-12-01). “How to Win Friends and Influence People with the SAS Output Delivery System”. Clinical Medicine & Research [англ.]. 8: 189—190. DOI:10.3121/cmr.2010.943.c-c1-04. PMID 3006529.
- ↑ Der, Geoff; Everitt, Brian S. (2009-03-10). “Basic Statistics using SAS Enterprise Guide”. Journal of the Royal Statistical Society, Series A [англ.]. 172: 530. DOI:10.1111/j.1467-985X.2009.00588_2.x.
- ↑ Schermerhorn, John R. Exploring Management : [англ.] / John Wiley & Sons. — 2011-10-11. — P. 3. — ISBN 978-0-470-87821-7.
- ↑ 1 2 3 Spector, Phil Университет Калифорнии, Беркли: An Introduction to the SAS System (англ.). stat.berkeley.edu. Дата обращения: 4 октября 2013. Архивировано 12 октября 2013 года.
- ↑ Chapman, David Determine what SAS Version and Components are available (англ.). NESUG (2012). Дата обращения: 13 июля 2023. Архивировано 8 апреля 2018 года.
- ↑ 1 2 Nourse, E. Shepley; Greenberg, Bernard G.; Cox, Gertrude M.; Mason, David D.; Grizzle, James E.; Johnson, Norman L.; Jones, Lyle V.; Monroe, John; Simons, Gordon D. (1978). “Statistical Training and Research: The University of North Carolina System”. International Statistical Review / Revue Internationale de Statistique [англ.]. 46: 171. DOI:10.2307/1402812. ISSN 0306-7734.
- ↑ 1 2 SAS Institute FDA Intellectual Partnership for Efficient Regulated Research Data Archival and Analysis (англ.). Доклад в Duke University (12 апреля 2000). Дата обращения: 28 сентября 2011. Архивировано 24 августа 2000 года.
- ↑ Dalesio, Emery. Little-known software giant to raise its profile (англ.) (5 May 2001). Дата обращения: 8 апреля 2014.
- ↑ Kaplan, David. SAS: A new no. 1 best employer (англ.) (22 January 2010). Архивировано 29 ноября 2011 года. Дата обращения: 8 апреля 2014.
- ↑ Barr, Anthony; Goodnight, James (1976). “The SAS Staff” [англ.].
SAS 72 and SAS 76 are attributed to Barr, Goodnight, Service, Perkins, and Helwig
- ↑ 1 2 Aster, Rick History of SAS version (англ.). Global Statements. Дата обращения: 4 октября 2013. Архивировано 19 апреля 2025 года.
- ↑ Barr, Anthony. Statistical analysis system : [англ.] / Anthony Barr, James Goodnight, James Howard. — North Carolina State University, 1971.
- ↑ Barr, Anthony. SAS Programmer's Guide : [англ.] / Anthony Barr, James Goodnight, John Sall … [et al.]. — SAS Institute, Inc., 1979.
- ↑ SAS corporate timeline (англ.) (3 March 2011). Архивировано 31 июля 2013 года. Дата обращения: 17 октября 2011.
- ↑ Cox, Ian. Visual Six Sigma: Making Data Analysis Lean : [англ.] / Ian Cox, Marie A. Gaudard, Philip J. Ramsey … [et al.]. — John Wiley & Sons, 2009. — P. 23. — ISBN 978-0-470-50691-2.
- ↑ Lafler, Kirk Paul. PROC SQL: Beyond the Basics Using SAS, Second Edition : [англ.]. — SAS Institute, 2013. — ISBN 978-1-61290-027-8.
- ↑ Supported Operating Systems (англ.). SAS Institute. Дата обращения: 6 октября 2012. Архивировано 23 июля 2025 года.
- ↑ Steven, Dave. SAS is Starting to Look Even Better... (англ.) (29 July 2002). Архивировано 15 апреля 2012 года. Дата обращения: 17 октября 2011.
- ↑ Whiting, Rick. SAS Extends Business Intelligence to the Masses (англ.) (31 March 2004). Архивировано 3 мая 2012 года. Дата обращения: 17 октября 2011.
- ↑ Hardy, Quentin. SAS-We Spurned IBM, Now to Win (англ.) (9 June 2011). Архивировано 30 ноября 2024 года. Дата обращения: 17 октября 2011.
- ↑ Jackson, Joab. SAS enlarges its palette for big data analysis (англ.) (27 April 2015). Архивировано 28 ноября 2018 года. Дата обращения: 22 мая 2015.
- ↑ The functionality of a computer program and the programming language cannot be protected by copyright (англ.). European Court of Justice. Дата обращения: 19 мая 2012. Архивировано 27 августа 2025 года.
- ↑ How old is your version of SAS? Release dates for SAS software (англ.). Архивировано 19 апреля 2023 года. Дата обращения: 26 апреля 2023.
- ↑ Whiting, Rick. SAS Ships Customer-Intelligence App (англ.) (11 May 2004). Архивировано 12 января 2014 года. Дата обращения: 7 января 2014.
- ↑ Yasin, Rutrell. Social network analysis, predictive coding enlisted to fight fraud (англ.) (10 May 2013). Архивировано 27 ноября 2018 года. Дата обращения: 11 декабря 2013.
- ↑ Iraq Telecom Monthly Newsletter November 2009 : [англ.] / Information Gatekeepers Inc ; Hui Pan. — P. 5.
- ↑ SAS Launches Suite Of Solutions For IT (англ.) (22 September 2004). Архивировано 15 апреля 2012 года. Дата обращения: 12 декабря 2013.
- ↑ Free SAS® Software for Higher Education, Adult Learners Now Available (англ.). businesswire (28 мая 2014). Дата обращения: 6 января 2019. Архивировано 25 февраля 2024 года.
- ↑ SAS Academic Software (англ.). SAS. Дата обращения: 19 октября 2022. Архивировано 19 августа 2025 года.
- ↑ Acock, Alan C. (2005-11). “SAS, Stata, SPSS: A Comparison”. Journal of Marriage and Family [англ.]. 67: 1093—1095. DOI:10.1111/j.1741-3737.2005.00196.x. Проверьте дату в
|date=(справка на английском) - ↑ Compare Packages (англ.). University of California, Los Angeles. Дата обращения: 12 января 2014. Архивировано 12 января 2014 года.
- ↑ Ranii, David. SAS' revenue up 12% in 2011 (англ.) (20 January 2012). Архивировано 7 сентября 2014 года. Дата обращения: 12 января 2014.
- ↑ Henschen, Doug SAS goes cloud but will customers follow? (англ.). ZDnet. Дата обращения: 16 июня 2023. Архивировано 28 апреля 2016 года.
- ↑ Baer, Tony SAS is on the brink of generation change (англ.). ZDnet. Дата обращения: 16 июня 2023. Архивировано 6 октября 2025 года.
- ↑ Avidon, Eric SAS Viya gets architectural overhaul in latest update (англ.). TechTarget. Дата обращения: 16 июня 2023. Архивировано 6 октября 2025 года.
- ↑ Relationship between SAS 9.4 and SAS Viya (англ.). SAS Help Center. Дата обращения: 16 июня 2023. Архивировано 28 октября 2023 года.
- ↑ Just How Big Is the Big Data Market? (англ.). ClickZ (7 июля 2014). Дата обращения: 7 июля 2014. Архивировано 25 октября 2015 года.
- ↑ Vesset, Dan Worldwide Business Analytics Software 2013–2017 Forecast and 2012 Vendor Shares (англ.). IDC. Дата обращения: 2 октября 2013. Архивировано 16 апреля 2025 года.
- ↑ Pendse, Nigel Consolidations in the BI industry (англ.). The OLAP Report (7 марта 2008). Дата обращения: 13 июля 2023. Архивировано 10 июля 2013 года.
- ↑ Dembe, A. E.; Partridge, J. S.; Geist, L. C. (2011). “Statistical software applications used in health services research: Analysis of published studies in the U.S”. BMC Health Services Research [англ.]. 11: 252. DOI:10.1186/1472-6963-11-252. PMC 3205033. PMID 21977990.
Ссылки
- Официальный сайт SAS (на английском)
- SAS OnDemand для академических пользователей — бесплатный доступ студентам (требуется профиль SAS, на английском)
- Глоссарий терминов SAS (на английском)
- Портал для разработчиков SAS (на английском)
- Сообщество пользователей SAS (на английском)