JASP
JASP — свободная программа с открытым исходным кодом для статистического анализа, разрабатываемая при поддержке Амстердамского университета. Название расшифровывается как «Jeffreys’ Amazing Statistics Program»[2]. JASP ориентирована на простоту использования и интуитивно понятный интерфейс, близкий пользователям SPSS. Программа позволяет проводить стандартные статистические анализы как в классическом (частотном), так и в байесовском вариантах[3][4]. JASP автоматически формирует таблицы результатов и графики в стиле APA, что облегчает подготовку публикаций. Система поддерживает принципы открытой науки благодаря интеграции с Open Science Framework и обеспечивает возможность воспроизводимости исследований путём сохранения параметров анализа вместе с результатами. Разработка JASP финансируется рядом университетов и исследовательских фондов.
Общие сведения
| JASP | |
|---|---|
| Тип | статистический пакет |
| Разработчик | Амстердамский университет |
| Написана на | C++, R, JavaScript, QML |
| Операционные системы | Microsoft Windows, Mac OS X, ChromeOS, Linux |
| Последняя версия | |
| Репозиторий | github.com/jasp-stats/ja… |
| Лицензия | GNU Affero General Public License |
| Сайт | jasp-stats.org |
Возможности анализа
JASP позволяет проводить как частотный, так и байесовский анализ на одних и тех же статистических моделях. Частотный анализ использует p-значения и доверительные интервалы для контроля ошибок при гипотетически бесконечных повторениях эксперимента. Байесовский анализ оперирует достоверностными интервалами и байесовскими факторами[5][6] для оценки параметров модели и подтверждения (или опровержения) гипотез по данным и априорной информации.
Следующие виды анализа доступны в JASP (сравнение с SPSS):
| JASP 0.19.3 | SPSS 30 | JASP 0.19.3 | SPSS 30 | |
| Анализ | Классический | Классический | Байесовский | Байесовский |
| Приёмочный контроль (Acceptance Sampling) | ✓ | X | ||
| (многократные) (M)AN(C)OVA и непараметрика | ✓ | ✓ | (✓) | (✓) |
| Аудит — статистические методы аудита | ✓ | X | ✓ | X |
| Bain — оценка информативных байесовских гипотез | ✓ | X | ||
| BSTS — байесовский структурный временной ряд | ✓ | X | ||
| Круговая/направленная статистика | ✓ | X | X | X |
| Кохрейновский мета-анализ | ✓ | X | ✓ | X |
| Описательные статистики (графики Rainclouds, Flexplots, временные ряды) | ✓ | (✓) | ||
| Распределения (непрерывные и дискретные) | ✓ | X | ✓ | X |
| Эквивалентные t-тесты (TOST): независимые, парные, по одной выборке | ✓ | X | ✓ | X |
| Факторный анализ (PCA, EFA, CFA) | ✓ | ✓ / AMOS | X | X |
| Частоты (биномиальные, мультиномиальные, таблицы сопряжённости, χ², лог-линейная регрессия) | ✓ | ✓ | ✓ | (✓) |
| JAGS (байесовский "чёрный ящик" — Марковский симулятор) | ✓ | (AMOS) | ||
| Обучение статистике (классический и байесовский модули) | ✓ | X | ✓ | X |
| Машинное обучение (кластеризация, дискриминантный анализ) | ✓ | ✓ | X | X |
| Мета-анализ многомерный (размер эффекта, графики воронки и др.) | ✓ | ✓ | ✓ | X |
| (Обобщённые или линейные) смешанные модели | ✓ | ✓ | ✓ | X |
| Сетевой анализ | ✓ | ✓ | ✓ | X |
| Анализ мощности/расчёт выборки | (✓) | (✓) | X | X |
| PROCESS (модели медиации и модерации по Hayes) | ✓ | ✓ | ✓ | X |
| Прогнозирование (Prophet, временные ряды) | X | ✓ | ✓ | X |
| Контроль качества | ✓ | (✓) | X | X |
| Регрессия/корреляция (r, ρ, τ, линейная и др.) | ✓ | ✓ | (✓) | (✓) |
| Надёжность (Reliability) | ✓ | ✓ | (✓) | X |
| Структурное моделирование (PLS, рост, MIMIC) | ✓ | AMOS | X | X |
| Сводная статистика (Summary statistics) | X | X | ✓ | X |
| Непараметрический и полу-параметрический анализ выживаемости | ✓ | ✓ | X | X |
| t-тесты: независимые, парные, по одной выборке (включая байесовские) | ✓ | ✓ | ✓ | (✓) |
| Визуальное моделирование (построение графиков, смешанные модели) | ✓ | ✓ | X | X |
| Актуальная версия таблицы доступна по ссылке https://docs.google.com/spreadsheets/d/1lQ7Pt8vFfSrHxQ9Kh3rjY6Ttx2Yx5b1sVKEGLYU9v4Y/edit#gid=0 | ||||
| Источники: https://jasp-stats.org/features/ и официальная документация IBM SPSS | ||||
| Пустое поле означает, что функция может отсутствовать | ||||
Прочие возможности
- Редактирование и подсветка синтаксиса R.
- Редактирование графиков и формул (LaTeX).
- Экспорт результатов в PDF или HTML, таблиц — в формате LaTeX, графиков — в PNG, PPTX (PowerPoint) и др.
- Импорт файлов Excel, SPSS и других (включая .xls, .xlsx, .csv, .txt, .tsv, .ods, .dta, .sav, .zsav, .por, .sas7bdat, .sas7bcat, .xpt, .jasp).
- Подключение к базам данных SQL и Open Science Framework.
- Фильтрация данных: выбор случаев с помощью R-кода или drag-and-drop GUI.
- Полное редактирование данных с возможностью быстрого перекодирования, поддержка полного undo/redo.
- Вычисление новых столбцов через код R (например, rowMean, rowMeanNaRm, rowSum, rowSD и др.) или GUI.
- Настройка обработки пустых значений по переменной, набору данных или глобально.
- Проверка статистических предположений: экспорт и анализ остатков; проверка предположений с помощью тестов и графиков (Левена, Брауна-Форсайта, Шапиро — Уилка, Q-Q, Raincloud и др.)
Модули
По умолчанию в JASP активны семь основных модулей:
- Descriptives: исследование данных с помощью таблиц и графиков.
- T-Tests: оценка различий между двумя средними.
- ANOVA: сравнение нескольких средних.
- Mixed Models: сравнение средних с учётом случайных эффектов.
- Regression: анализ связей между переменными.
- Frequencies: анализ частотных данных.
- Factor: исследование скрытых структур в данных.
Дополнительные модули, которые можно включать в меню модулей:
- Acceptance Sampling: методы приёмочного контроля и контроля качества.
- Audit: статистические методы для аудита. Модуль позволяет планировать, отбирать и оценивать статистические аудиторские выборки, аудит данных (например, закон Бенфорда) и аудит алгоритмов (например, справедливость моделей).
- Bain: байесовская оценка информативных гипотез[7] для t-тестов, ANOVA, ANCOVA, линейной регрессии и структурного моделирования.
- BSTS: байесовский подход для временных рядов (линейные гауссовские state space models).
- Circular Statistics: методы для направленных данных.
- Cochrane meta-analyses: анализ медицинских данных Cochrane.
- Distributions: визуализация распределений и их подгонка по данным.
- Equivalence T-Tests: тестирование разницы между средними при интервальной нулевой гипотезе.
- JAGS: построение байесовских моделей с помощью JAGS для Марковских цепей.
- Learn Bayes: изучение байесовской статистики на простых примерах с пояснениями.
- Learn Stats: изучение классической статистики на примерах.
- Machine Learning: анализ взаимосвязей данных средствами обучения с учителем и без учителя. Модуль включает 19 видов анализа для регрессии, классификации и кластеризации:
- Регрессия
- Boosting Regression
- Decision Tree Regression
- K-ближайших соседей (KNN) для регрессии
- Нейронные сети для регрессии
- Случайный лес для регрессии
- Регуляризованная линейная регрессия
- Методы опорных векторов (SVM) для регрессии
- Классификация
- Boosting Classification
- Decision Tree Classification
- K-ближайших соседей (KNN) для классификации
- Нейронные сети для классификации
- Линейная дискриминантная классификация
- Случайный лес для классификации
- Методы опорных векторов (SVM) для классификации
- Кластеризация
- Кластеризация на основе плотности
- Fuzzy C-Means
- Иерархическая кластеризация
- Модельная кластеризация
- Кластеризация на основе соседства (например, K-средних, K-медиан, K-медоидов)
- Случайный лес для кластеризации
- Регрессия
- Meta Analysis: объединение результатов различных исследований; включает методы фиксированного и смешанного эффекта, регрессию, графики леса и воронки, тесты асимметрии, корректировку на публикационное смещение.
- Network: анализ связей между переменными в виде сети.
- Power: проведение анализа мощности.
- Predictive Analytics: предиктивная аналитика.
- Process: реализация популярных моделей PROCESS Хейса для JASP.
- Prophet: простое моделирование для прогнозирования временных рядов.
- Quality Control: проверка соответствия продукции стандартам качества.
- Reliability: оценка надёжности тестовых баллов.
- Robust T-Tests: устойчивые t-тесты для сравнения средних.
- SEM (структурное моделирование): анализ скрытых переменных с помощью библиотеки lavaan[8].
- Summary statistics: применение байесовских тестов на основе частотных сводных данных (t-тест, регрессия, биномиальный тест).
- Survival Analyses: анализы выживаемости (не- и полупараметрические методы).
- Time Series: анализ временных рядов.
- Visual Modeling: графический анализ зависимостей между переменными.
- R Console: выполнение кода R в консоли.