データ確認
Summary と Table の 2 つの見方で、列型、欠損率、ユニーク数、サンプル値、行データを確認できます。
DataCello は、CSV の確認、仮説検定や回帰などの分析設定、結果確認、CSV エクスポートまでを 1 つのワークスペースで完結できる macOS アプリです。このドキュメントは、実際の操作手順に絞ってまとめています。
現在の DataCello は CSV ベースの分析にフォーカスしています。 まずデータを理解し、そのまま分析条件を組み立てて実行する設計です。
Summary と Table の 2 つの見方で、列型、欠損率、ユニーク数、サンプル値、行データを確認できます。
目的変数、特徴量、グループ列、アルゴリズム固有の設定を Inspector と Analytics 画面で詰められます。
分析設定の保存、結果サマリーのコピー、結果テーブルの CSV エクスポートに対応しています。
最初の利用では、下の順番で進めると迷いません。
起動後にローカル runtime をインストールします。Apple Silicon Mac が前提です。
ツールバーの Import CSV か Sample からデータを開き、列型と欠損状況を確認します。
Analytics で分析タイプを選び、対象列を指定して Run を押します。警告やエラーは Inspector に出ます。
Summary、チャート、テーブルを見ながら、CSV Export または Copy Summary を使います。
各分析には必要な列型があるため、最初に列の型判定を確認しておくのが安全です。
回帰、分類、時系列予測をサポートしています。目的変数や日付列の指定が中心です。
K-means と PCA で、クラスタ傾向や多変量の構造把握に使えます。
t 検定、ANOVA、Wilcoxon、Kruskal-Wallis、カイ二乗などの仮説検定を扱えます。
Kaplan-Meier と Cox モデルに対応し、時間列とイベント列を設定して実行します。