Workflow

画面ごとの役割を先に把握する

DataCello は Sidebar、メインワークスペース、Inspector の 3 領域で構成されています。どこで何を見るかを決めておくと、作業が速くなります。

領域 用途 典型的な操作
Sidebar データセットや保存済み分析を切り替える 読み込んだ CSV を選ぶ、保存済み分析を開く
Summary / Table / Analytics データ確認と分析実行の中心 列を確認する、分析条件を組む、結果を見る
Inspector 補助情報と検証結果の確認 選択列の詳細、Validation、失敗内容、実行ログを見る
Summary / Table

データを理解してから分析に入る

分析条件を先に触るより、列型と欠損の確認を済ませた方がやり直しが減ります。

Summary

列ごとの統計やスナップショットを見る場所です。列を選ぶと Inspector に詳細が出ます。

  • 欠損率
  • ユニーク数
  • サンプル値
  • 型別の集計情報

Table

行レベルでデータを確認する場所です。列名検索と型フィルタを使うと目的の列を絞れます。

  • 実データの確認
  • 列検索
  • 列型フィルタ
  • 読み込みミスの目視確認
Analytics

分析ワークスペースの使い方

Analytics では、左で設定し、右で結果を読みます。上部には保存、実行、キャンセル、エクスポートがあります。

カテゴリと分析タイプ

まずカテゴリを切り替え、その中から具体的な分析タイプを選びます。

共通設定

Target、Features、Grouping など、複数分析で共通する列設定を入れます。

個別オプション

学習比率、標準化、クラスタ数、予測期間、成分数などを分析タイプに応じて指定します。

保存

Save を押すと、現在の分析設定を保存済み分析として残せます。同じデータセットに対して複数パターンを管理する用途向けです。

結果の出力

Export から結果テーブルを CSV に書き出すか、Summary をクリップボードへコピーできます。

Inspector

詰まったら最初に見る場所

  • Run Status で現在の実行状態を確認する
  • Validation でブロック要因か警告かを切り分ける
  • Failure で実行失敗の内容を読む
  • Logs でエンジン実行時の補助ログを追う