Statisticsライブラリ
- 統計解析を行うライブラリです。
- 副産でつくったMathMatrixの方が使えるかも。
構成
- BasicStatisticsクラス: 基礎統計クラス(平均・分散・共分散など、基本的な統計計算を行う静的クラス)
- Matrix:行列関連クラス
- MathMatrixクラス: 行列計算クラス(2元配列をベースとした、行列計算を行う静的クラス)
- 一部、nutsuさんのソースを参考にさせていただきました。
- MathObjectクラス: 行列オブジェクトクラス(MathMatrixクラスをベースに、データの保持機能を加えたクラス)
- MathMatrixクラス: 行列計算クラス(2元配列をベースとした、行列計算を行う静的クラス)
- MultivariateAnalysis: 多変量解析関連クラス
- PrincipalComponentAnalysis: 主成分分析クラス(データ全体の構造を分析する手法)
- QualificationIV: 数量化理論Ⅳ類クラス(データの位置関係を分析する手法)
- test:検定関連クラス
- Ttest: t検定クラス
- ANOVA: 一元配置分散分析クラス
コード
使い方
- 各クラスのコメントを参照(一通り完成したらまとめたいと思います。)
- 基礎統計クラスパッケージ
- 行列クラスパッケージ
参考
*Spark project 勉強会 #02でyossyさんよりご質問いただいた、ライブラリ作成にあたっての参考書ですが、基本的なところはこの本をそのまま移植しました。
ただ、多変量解析を行うための固有値、固有ベクトルの計算などの処理(ヤコビ法とか)はCやJAVAで公開されているものを元に、解析して移植しました。これが一番面倒やった。
ロードマップ的なもの
- 固有値計算の際のfor文処理が重いので、TIMERとかで繰り返すように変更する予定
- Threadをお借りして、処理を簡単にしたい
- 実践的なアプリをつくる(つーか、昔作ったものが消えたので、リビルドする)
- 他の解析を組み込む