算盤から電卓へ。そしてエクセルへ。そして可視化
クロス表があったら、マップ化してみよう。意味が浮かんできます。
問題があったら、データをクロス表に落として見よう。ソリューションの仮説が見えてきます。
連環データ分析は、クロス表データを、手軽に可視化し、意味を持つ情報、使える知識に変換する支援ツールです。
  • 今まではクロス表データを集計したり、何枚ものグラフを書いていますが、ざっくりと全体を眺めてみませんか?
  • 検討すべき事象に関する定量、定性、文章等の多様なデータや資料を統合し、意味のある情報を取り出し表現してみませんか?
  • いろいろな人が持っている情報や衆知を統合し、多くの人が使えて役に立つ集合知を形式化し、共有してみませんか?

連環データ分析とは

何ができるか

連環データ分析は、あらゆるタイプのデータを可視化し、意味のある情報を抽出し、役に立つ知識を創出するデータマイニングとテキストマイニングを統合処理します。

実験データ、観察データ、調査データはもちろん、箇条書きされた事象、さらにはグループ討議や講演文章でも、クロス表として整理でき、可視化できます。

多くの問題では、対象とする事象が数値と共に言葉や文字などが混在するデータとして記録されており、それらの関係性を保ったままで分析する必要があります。

クロス表は、ある事象を表側に、それにまつわる幾つかの属性を表頭にとり、その環連性をまとめたものです。クロス表から表側と表頭の関係を読み取るのは大変ですが、可視化することで、それが容易になります。

特徴

多重対応分析ではできなかった、量的データ、質的データやテキストデータ等のあらゆるタイプのデータを、同時に統合的に扱えるように拡張することができました。

従来の多次元データ解析では許されなかった、表側(サブジェクト)と、表頭(アトリビュート)を同時布置して、統合MAP化ができるようになりました。

従って、同時クラスタ化も、世界に先駆けて、実現することができました。

これによって、一枚のクロス表のサブジェクトとアトリビュートの関係だけでなく、複数のクロス表から、いろいろな文脈で広い範囲のデータの相互の関係を読むことが可能になったのです。

連環データMAPの成立ちと見方

連環データ分析では、表形式のデータを、可視化して連環データMAPを造ります。

そのMAPには、表側のアイテムと表頭のアイテム名が、同時に布置されるので、お互いの位置関係を読み取ることができます。

似た表側アイテム同士、似た表頭アイテム同士が近くに、また似た表側と表頭のアイテム同士も近くに布置されます。

アイテムの位置が同じもの同志が、同じ内容の意味となります。その位置の原点からの方向と距離が、意味を持つことになります。

方向が意味の内容を示します。

2つのアイテムのベクトルの意味の相関性は、それらのベクトル創る角度のコサインとなります。

距離が、意味の強さを示します。

あるアイテムの意味の強さは、原点からの長さとなります。

こうして、サブジェクトとアトリビュートの近いものと遠いものの関係を理解することができます。

全体の構成を類型化して理解する

表頭と表側のアイテムの似たもの同志がお互いに近くに布置されますので、同時にクラスタリングでき、意味が読み取り易くなります。

全体を、幾つかの似たもの同志で括って、クラスター化ができ、分類でき、全体を理解できます。サブジェクトと関連するアトリビュートを同時にクラスター化を、世界に先駆けて実現できました。

そのため、まず表側アイテムでクラスタリングし、表頭アイテムをそのクラスタに配分することができます。これにより、クラスタの特徴が理解し易くなりました。

コサイン距離でクラスタリングすることで、隣接クラスタや反対側のクラスタと比べて、クラスタの特徴を明確に理解できます。

アイテムをMECEに分析できることで、空いた領域やその意味を探索することができます。

また、多段階にクラスタ化ができますので、アイテムが多くても、数百にクラスタ化しても、意味を一貫性を持って理解できます。

グラウンデッドセオリーなどでは、クラスタにラベル付を行うクラスタ・オープンコーディングや、軸の意味づけをする軸足コーディングやクラスタ間の関係性コーディングが必要ですが、そうした作業が容易になりました。

馬蹄形の分布

連環データ分析は、社会的な事象を分析する時、優位性が現れます。社会現象は、正規分布から外れ、歪んだベキ乗分布(極値分布)がしばしば現れます。

サブジェクトがあるカテゴリーや集団のアイテムからなる場合は、多くの場合、そのマジョリティが原点の中心近くに固まって、センターを構成します。

一方、その対抗勢力が、そこから離れ、個性的なマイノリティを形成して、いわゆる馬蹄形を形成することがあります。こうした分布から、全体の動きや、トレンドを理解することができる場合があります。

連環データ分析の考え方

連環データ分析では、元のクロス表を情報圧縮して近似展開し、MAP化します。アルゴリズムは、特異値分解による次元圧縮法で、得られた座標をクロス表毎にセンタリングとスケーリングとデレクティングをして重ね合せを実現しています。

  • 連環データ分析は、関心の対象の集合やカテゴリーが、関係する集合やカテゴリーと、連環するデータで結ばれたクロス表の特徴を抽出します。
  • 多くの場合、中央に「典型」、左右に「革新」と「伝統」が現れます。
  • 評価尺度がある場合、中央に「センター」、左右に「チャレンジャー」と「フォロワー」が現れます。
  • いずれの場合も、「センター」、「典型」が"中央に位置するマジョリティ"で、中央から離れて、マイノリティが位置します。
  • MAP化のポジション例
    • クロス表を情報圧縮して近似展開し、MAP化します。

    従来の多次元データ解析法との違い

    従来の多次元データ解析法は、複数枚のクロス表を組み合わせて解析することができませんでした。

    従来の主成分分析、数量化Ⅲ類、双対尺度法、正準相関分析、多重対応分析、クラスタ分析等の、変数の相互依存関係をあつかう多次元データ解析では、計数値、順序値、計量値等の、複数の定量値を同時に扱うことはできませんでした。

    まして、定量値に加え、バイノミアル、マルチノミアルなどの表示値や、距離やネットワーク関係を背後に持つ言葉などの定性値を同時に統合して扱うことは、できませんでした。

    また、特性と要因の依存関係を扱う多重回帰、分散共分散構造分析等いわゆる教師ありデータ問題では、変数間の相関がもたらすモデルの脆弱性から逃れることができませんでした。

    多重対応分析も複数のクロス表を扱えるとしていますが、総クロス集計表にまとめていますので、プロファイルデータを扱えないため、プーリングによるシンプソンのパラドックスのような逆の結果に導かれたりします。

    連環データ分析は、いわば多重対応分析を拡張し、各種のデータタイプを同時に統合して扱えるようにすると同時に、従来は変数間の相互依存関係や一方向依存関係を扱う方法に分離されていたソフトを統合することができました。

    ワークショップやブレーンストーミングなどでは、意見やアイデアを発散的に集めることはできましたが、集約が困難でした。キーワードやトピックの繋がり分析は、キーグラフやPLSA(確率的潜在意味解析法)等で可視化してみますが全体の意味構造を意味を持つ形で可視化できず、ヒトと機械が議論を深めることが困難でした。

    最近は、ビッグデータが得られその概要を単純集計やデータプロファイル分析が使われているが、プロセスに試行錯誤が入り、念入りにキー要因を組み合わせないと、逆の概要を掴んだりし兼ねません。効果的なデータクリンジングを行ったり、データ品質を得るのに苦労します。

    簡単にプロファイルデータを可視化するのが効果的です。

    回帰分析では、量特性を量要因で説明していたが、量特性を言葉等の質要因との関係を見たり、質特性を質要因で説明する必要性が出てきている。

    分散分析では、交互作用効果が大切で、最近のDOEでは、3水準の1部実施法や、制限条件付完備型の実験計画や、多変量の特性をバランスsだせる最適DOEが開発されているが、それらの可視化ツールが、まだ十分ではない

    適用事例

    いま、全ての組織は、未来に向けて、ブレークスルーが求められています。 これは、現状の理解と、目指すべき目的の理解と、その道筋の理解との、いわば、3のベクトル群のマッチング問題といえます。

    現状と目的は、生活者の心を表現された言葉データで、そこに至る途筋は、専門家の技術的で形式的なデータです。そのためこの3群マッチオングには、異なったデータタイプを扱える”マッチング・マインド・マップ”が必要です。

    従来の連続生産、連続流通、連続改善ではなく、全ての組織が、いわば連続してイノベーションを実現するためのストーリー作りとその検証が必要です。

    そのためには、従来のデータ分析の専門家が使える分析ツールではなく、問題意識とデータを持った現場の人達が使え、情報を共有できる、いわば、セルフサービスBI.と言うべき、可視化ツールが必要です。

    Data.CakeBakerの“連環データ分析”は、現状とその目標に関わる情報の可視化の手段をご提供します。

    連環データ分析の適用事例
    業種・業界 適用例
    教育産業 ・学園の再開発のボトルネックイメージ診断
    ・私立中高一貫校のコンセプト開発支援
    飲食業 ・ビールのキャッチフレーズキーワード探索
    ・ファーストフードの新コンセプト仮説探索
    NPO/NGO
    非営利活動
    ・会員の活性化のための活動計画検討
    ・地域のイメージポジション診断
    製造業 ・電子精密機器の設計者用知識ナビゲータ
    ・重大事故発生モニタリングシステム
    ICT業界 ・ビジネスアイデア開発ファシリテータ支援
    ・講演内容の可視化研究

    多様なデータを可視化し意味のある情報を得る

    ICTの発展によって、あらゆる組織は、多様な活動と多様なプロダクツやサービス等のパフォーマンスで、社会と関わり自らを表現しております。このような外在化された成果は、多様なステークホルダの視点から意味のある情報として得ることができるようになりました。

    従来は、組織のカベ、専門のカベ、データタイプのカベ等によって妨げられていたデータを連環して、可視化することは容易にはできませんでした。

    また内部のデータ群と外部の調査データや個別で単発的なデータ等を連環することができませんでした。それは、定性データや定量データを構成するアイテムのネットワークの連環度を同時に扱う方法が無かったからです。

    組織が効果的なパフォーマンスを実現するために、データとデータの関係を可視化し、多様で意味のある情報と、役立つ知識を抽出する手段を提供します。

    利用するには

    連環データ分析は、お手軽に、手元のパソコンにソフトをダウンロードしてお使い頂けます。ご利用形態は、ソフトウェア・アズ・ア・サービス(SaaS)として、何時でも最新版をご利用頂く形になっております。ご利用は、12ヶ月のレンタルサービスです。

    • クロス表を、情報圧縮し、MAP化して可視化します。
    連環データ分析の流れ

    基本機能

    1. 解析対象アイテムを表側に、その属性のアイテムを表頭に、それらの連環度からなる表形式のクロス表データを可視化します。
    2. 解析対象の集合をサブジェクトとし、その属性の集合をアトリビュートとし、それらのアイテムのネットワークの連環強度をクロス・データとしたとき、その情報圧縮を行い、少数次元のMAPを構成して可視化します。
    3. 連環データ分析は以下の基本機能を持っています。
      • サブジェクトとアトリビュートの各アイテムの同時布置
      • サブジェクトとアトリビュートの各アイテムの同時クラスタリング
      • 3次元意味空間のウォークスルー
      • 定性的・定量的・順序的変数の統合的扱い
      • 社会現象に多発する”べき乗分布”データの平準化オプション

    ※連環データ分析の基本機能には、テキストマイニング機能は含まれて居りません。連環ソリューションとして、別途サービス提供をしております。

    システム環境

    • 主記憶装置:8.0 GB以上のRAMを推奨
    • 補助記憶装置:400GB以上のハードディスク空き容量を推奨
    • ビデオメモリ:128 MB以上のVRAMを推奨
    • オペレーティング・システム:Microsoft Windows 7(64bit版)以上
    • Microsoft Excel 2007以上がインストールされていること(データの入力に利用)
    • インターネットに接続されていること
    • Java Runtime Environment 6(JRE 6) 以上JAVA8までのいずれかがインストールされていること(※1)
    • ※1 JAVA9以上へのアップデートは、お奨めしません。また、JAVA32ビットがある場合は、削除をお願いします。

    連環データ分析・プロダクツシリーズ
    カタログ・パンフレット

    • 連環データ分析ベイシック:単純クロス表データ
    • 連環データ分析スタンダード:水平連結型クロス表データ
    • 連環データ分析アドバンスド:複合連結型クロス表データ
    レンタルサービス・プロダクツ
    扱うクロス表形式
    (クロス表数)
    商品名 商品型番 代表型番 ご利用料金
    (税別)
    単純クロス表データ
    (クロス表1枚)
    連環データ分析
    ベイシック
    DcbAnalysis
    Basic 1.085
    DCB-AB1 9万円/365日人
    水平連結クロス表データ
    (縦1段X横20連、計20枚までのクロス表)
    連環データ分析
    スタンダード
    DcbAnalysis
    Standard 1.085
    DCB-AS2 18万円/365日人
    複合連結重み付クロス表データ
    (縦7段X横20連、計140枚までのクロス表)
    連環データ分析
    アドバンスド
    DcbAnalysis
    Advanced 1.085
    DCB-AA3 48万円/365日人

    販売中の商品パンフレット(PDFファイル)をダウンロードできます(以下のアイコンをクリックしてください)。閲覧にはAdobe Reader等が必要です。

    ベイシック
    パンフレット
    スタンダード
    パンフレット
    アドバンスド
    パンフレット
    連環データ分析
    総合パンフレット
    ベイシックパンフレット スタンダードパンフレット アドバンスドパンフレット 統合パンフレット

    • DCB-AB1, DCB-AS2, DCB-AA3は、弊社のWebサイトから常に最新版をダウンロードし、起ち上げてお使い頂く形になっております。(Java Web Start Technologyを利用しております)
    • ご利用していただく際にはダウンロード前に申し込みをして頂き、ユーザIDとライセンスキーを入手する必要があります。

    商品と機能の対応

    • 連環データ分析ベイシック
      • 1枚のクロス表データから、意味を読み取るため、表側と表頭アイテムを1枚のマップに布置し可視化します。
      • それらのアイテムの関係が持つ意味を原点からの方向で示し、意味の強さを原点からの長さで示します。
      • アイデアや文章に含まれるキーワードの共起度データをクロス表に整理するとMECEなコンセプト分析も可能です。
      • 表側と表頭の各アイテムを、意味で同時クラスタリングし、いわば”コンセプト・コンパス・チャート”が造れます。
      • 従来主成分分析は計量値を、対応分析は計数値と分担していましたが、連環データ分析はどちらも可能にしました。

    • 連環データ分析スタンダード
      • 表側アイテムを共有する計20枚までのクロス表データを連環データ分析します。
      • 全ての表側アイテムと表頭アイテムを、同一マップに同時布置し、同時クラスタリングできます。
      • 従来、回帰分析はKPI等の量的変数を量的変数で説明できましたが、量的変数を言葉等の質的変数でも説明できKPIの改善の方向が判ります。
      • さらに質的変数と量的変数が混ざった、頑健な関係性モデルを得ることができ、多様な応用範囲が広がっています。
      • 教師ありデータの変数の内部構造モデルを得る回帰分析や潜在構造分析には、根本的に脆弱性がありましたがそれを克服することができました。

    • 連環データ分析アドバンスド
      • 表側アイテムと表頭のアイテムを共有する7段で20連の計140枚までのクロス表データを連環データ分析します。
      • 従来の多変量解析や多次元データ分析が扱えなかった、計量・計数・テキスト等の多様なデータを同時に扱えるようになりました。
      • イノベーションは、ヒトの言葉と、技術者の数値と、それらを仲介するプロトタイプとのいわば”マッチング・マインド・マップ”です。
      • ワークショップやリビングラボでは、アイデアが発散し、その集約が難しく、情報共有を困難にし、生産的な議論の時間を奪っています。
      • イノベーションの探索段階では、デザイン思考やグラウンデッドセオリー等が使われますが、データ分析の支援ツールが必要です。
    連環データ分析商品別アドバンテージ
    連環データ分析 機能
    連環データ分析製品表
    連環データ分析機能説明
    機能 説明
    同時布置
    同時クラスタ
    サブジェクト(表頭)とアトリビュート(表側)の各アイテムを一つのマップに布置し、可視化します。同一の空間にマップ化されたアイテムを、クラスタリングし、色を塗り分けます。
    立体表示 元のクロス表データを、情報圧縮技術で、2から5、6の次元の空間に近似して、可視化します。3D空間をウォークスルーできます。
    結線
    描画
    アイテムが、年や、順位などの属性があるときなど、順番に線で結んで、描画します。連環データ分析の計算結果を、プレゼン資料に使うための、絵の要素等を、簡単に作って、レイアウトや向き、色などを編集できます。
    多次元距離 少数次元の各アイテムの近さを表わすため、原点を見込む角度の余弦で、多次元の相関係数を計算します。それに[+1]を加えたものをアイテム間の連環度とします。
    標準距離 アイテム間のマップ上の通常のユークリッド空間上の距離を計算します。
    近さランクリスト サブジェクトのあるアイテムと近いアイテムの、近い順または、遠い順のリストを作ります。アトリビュートについても同様です。
    重み付け アイランドごとに、重みを付けることができます。
    感度分析 アイランドの感度や効果を調べることができます。

    ※全てのバージョンに、以下の基本機能が装備されています:
    1) プレゼン資料作成のためのキャプチャー機能
    2) 大きな値や、定性属性の[0、または1]のデータを平等に扱うための平準化機能。
    3) 大きさ、色、向きを調整する、きれいで見やすい日本語表示

    ※テキスト処理機能はありません。連環分析サービスまたは、日本電子計算(株)のWordMinerを推奨しております。 ご相談ください。

    処理プロセス概要

    1. サブジェクト VS. アトリビュートのクロス表を“エクセル”で入力します。
    2. 連環データ分析ソフト:"DCB Analysis"で、情報圧縮し、多次元空間MAPを得ます。すなわち、サブジェクトとアトリビュートのアイテムの多次元空間上での座標値を得ます。
    3. 結果は、第1軸&第2軸、または第1軸&第3軸等と組み合わせたり、第1,2,3軸からなる3次元空間にこれらのアイテムを選択して表示ができます。
    4. サブジェクトやアトリビュートを選んで、クラスタ分析ができ、任意の2次元上でMAPを構成することができます。