データサイエンスブログ

データ分析・統計・機械学習・自然言語処理関連

自然言語のクラスタリング2〜k-平均法(k-means)〜

f:id:yusuke091:20170509162835p:plain
前回は凝集型クラスタリングを行いましたが、今回はk-平均法(k-means)を使って、自然言語クラスタリングをしてみたいと思います。

※この記事は以下の書籍を参考に書かれています

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)

k-平均法(k-means)

最初に適当にk個のクラスタを作成する。各クラスタは平均ベクトルなどの代表ベクトルで表現される。
各事例ベクトル(クラスタリングを行いたいデータ)を、どのクラスタの代表ベクトルに近いかという基準にしたがって、クラスタに帰属させていく。
クラスタに含まれている事例ベクトルの平均を算出し、これを新たな代表ベクトルとする。
クラスタに変化がなくなるまで、この処理を繰り返す。

注意点

代表ベクトルの初期値は計算時間、クラスタリング結果に影響を与える。凝集型クラスタリングの結果を初期値として利用する方法もある。
代表ベクトルの再計算はすべての事例ベクトルをクラスタに帰属させてから行う。

自然言語データ

前回と同様に、TwitterのSearch APIで取得できる「#ジブリ」を含むツイート37件を利用する。
また、前処理も同様に、MeCabによる分かち書きと小文字化を行っておく。

自然言語の数学的表現

前回と同様に、bag-of-wordsを利用する。

クラスタリング

代表ベクトルの初期値

前回の凝集型クラスタリングの最終的な重心ベクトルを使用する。

--- クラスタ1の代表ベクトルの初期値 ---
[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.5714285714285714, 0.8571428571428571, 0.0, 0.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.14285714285714285, 0.0, 0.0, 0.2857142857142857, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.2857142857142857, 0.2857142857142857, 0.0, 0.0, 0.0, 0.14285714285714285, 0.14285714285714285, 0.14285714285714285, 0.42857142857142855, 0.0, 0.0, 0.0, 0.0, 0.42857142857142855, 0.0, 0.42857142857142855, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.14285714285714285, 0.0, 0.0, 0.14285714285714285, 0.0, 0.14285714285714285, 0.0, 0.14285714285714285, 0.14285714285714285, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.14285714285714285, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.2857142857142857, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.14285714285714285, 0.0, 0.14285714285714285, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.14285714285714285, 0.14285714285714285, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.14285714285714285, 0.14285714285714285, 0.14285714285714285, 0.14285714285714285, 0.0, 0.14285714285714285, 0.14285714285714285, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.2857142857142857, 0.0, 0.14285714285714285, 0.0, 0.0, 0.14285714285714285, 0.14285714285714285, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.14285714285714285, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
--- クラスタ2の代表ベクトルの初期値 ---
[0.045454545454545456, 0.09090909090909091, 0.09090909090909091, 2.6818181818181817, 0.3181818181818182, 0.0, 0.0, 0.0, 0.045454545454545456, 0.0, 0.0, 0.09090909090909091, 0.09090909090909091, 0.0, 0.0, 0.18181818181818182, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.22727272727272727, 0.09090909090909091, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.22727272727272727, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.22727272727272727, 0.09090909090909091, 0.045454545454545456, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.09090909090909091, 0.045454545454545456, 0.09090909090909091, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.09090909090909091, 0.13636363636363635, 0.0, 0.18181818181818182, 0.0, 0.045454545454545456, 0.0, 0.0, 0.0, 0.045454545454545456, 0.0, 0.5454545454545454, 0.0, 0.13636363636363635, 0.09090909090909091, 0.045454545454545456, 0.0, 0.2727272727272727, 0.3181818181818182, 0.0, 0.045454545454545456, 0.13636363636363635, 0.13636363636363635, 0.0, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.09090909090909091, 0.0, 0.0, 0.0, 0.045454545454545456, 0.0, 0.13636363636363635, 0.0, 0.045454545454545456, 0.22727272727272727, 0.0, 0.0, 0.0, 0.0, 0.0, 0.045454545454545456, 0.045454545454545456, 0.09090909090909091, 0.045454545454545456, 0.0, 0.045454545454545456, 0.09090909090909091, 0.0, 0.0, 0.0, 0.0, 0.045454545454545456, 0.045454545454545456, 0.09090909090909091, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.2727272727272727, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.13636363636363635, 0.045454545454545456, 0.13636363636363635, 0.0, 0.0, 0.09090909090909091, 0.045454545454545456, 0.13636363636363635, 0.09090909090909091, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.09090909090909091, 0.0, 0.0, 0.22727272727272727, 0.0, 0.045454545454545456, 0.09090909090909091, 0.09090909090909091, 0.5454545454545454, 0.0, 0.22727272727272727, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.09090909090909091, 0.0, 0.045454545454545456, 0.18181818181818182, 0.045454545454545456, 0.0, 0.0, 0.22727272727272727, 0.0, 0.045454545454545456, 0.0, 0.0, 0.5, 0.0, 0.0, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 1.0, 0.0, 0.0, 0.13636363636363635, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.0, 0.13636363636363635, 0.13636363636363635, 0.09090909090909091, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.13636363636363635, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.0, 0.0, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.09090909090909091, 0.09090909090909091, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.0, 0.0, 0.045454545454545456, 0.0, 0.0, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.13636363636363635, 0.13636363636363635, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.0, 0.045454545454545456, 0.0, 0.3181818181818182, 0.0, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.13636363636363635, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456, 0.0, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.045454545454545456, 0.0, 0.2727272727272727, 0.045454545454545456, 0.18181818181818182, 0.0, 0.0, 0.0, 0.0, 0.045454545454545456, 0.045454545454545456, 0.0, 0.045454545454545456]
--- クラスタ3の代表ベクトルの初期値 ---
[0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
--- クラスタ4の代表ベクトルの初期値 ---
[1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0]
--- クラスタ5の代表ベクトルの初期値 ---
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 2, 3, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0]
--- クラスタ6の代表ベクトルの初期値 ---
[0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0]
--- クラスタ7の代表ベクトルの初期値 ---
[0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 2, 0, 0, 0, 0, 1, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 2, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
--- クラスタ8の代表ベクトルの初期値 ---
[0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 2, 0, 1, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 2, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0]
--- クラスタ9の代表ベクトルの初期値 ---
[0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0]
--- クラスタ10の代表ベクトルの初期値 ---
[0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 2, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0]
結果

なんとクラスタリング結果は前回と同じになった(前回の結果を初期値として利用しているので当然かもしれない)。また、この最終的なクラスタリング結果は1度の処理で出力された。
もう少し異なる結果になれば面白かったのだが。

--- クラスタ1 ---
戦争 で 稼ぐ 奴 は 悪党 だ 。 〔 ジャンク 屋 の 親父 / 紅の豚 〕# ジブリ
私 なんか 、 美しかっ た こと なんて 一 度 も ない わ! 〔 ソフィー / ハウルの動く城 〕# ジブリ
音楽 やめ ぇい ! 〔 猫 王 / 猫の恩返し 〕# ジブリ
かわいそう に 、 髪の毛 を 切ら れる 方 が よっぽど つらい さ 。 〔 ドーラ / 天空の城ラピュタ 〕# ジブリ
お前 の 弁当 、 ずいぶん でっかい の な 。 〔 聖司 / 耳をすませば 〕# ジブリ
良い奴 は 皆 死ぬ 。 〔 ポルコ / 紅の豚 〕# ジブリ
そいつ ら 、 後で 泣く こと に なる な 。 まず 人間 に は 戻れ ない よ 。 〔 カルシファー / ハウルの動く城 〕# ジブリ

--- クラスタ2 ---
タイトル 組み合わせ 『 耳 すませ 豚 』 # ジブリ
仕事 を し て いる 二郎さん を 見る の が 一番 好き # ジブリ
エボシ : 首 だけ に なっ て も 食らい 付く の が 山犬 だ even cut off , the head can still bite もののけ姫 より # ジブリ # ghibli # 英語
♫ 朝焼け が 窓 を 染め た なら 君 に 告げよ う グッバイ モーニング … # bot # 魔女の宅急便 # kiki # ジブリ
マルクル … … 待た れ よ 。 stand by ハウルの動く城 より # ジブリ # ghibli # 英語
午後 から 幼稚園 の 観劇 会 文化会館 で つる の 恩返し を 観る よ 息子 に 伝え たら 、 あぁ … 猫 の 。 あれ か 。 と 。 まぁ いっか ! # ジブリ # 猫の恩返し # かんちがい
土 に 根 を 下ろし 、 風 と共に 生きよう 。 種 と共に 冬 を 越え 、 鳥 と共に 春 を 歌お う 。 (「# 天空の城ラピュタ 」 # シータ ) # ジブリ
♫ さみしく なる と たずねる 坂道 の 古本屋 … # bot # 魔女の宅急便 # kiki # ジブリ
たき ざわ はるか ? 贅沢 な 名前 だ ねぇ … 今日 から 、 あんた の 名前 は 、 ラーメン だ よ ! 早く 返事 を しぃ 、 ラーメン !! # ラーメンマン 伝説 # ジブリ
they ' ll change course for the nearest island as soon as they ' re out of sight . by ポルコ 見え なく なる まで 飛ん で すぐ 針路 を 変える に 違え ねえ # ジブリ # 紅の豚 # 英語 # 名言
タイトル 組み合わせ 『 借りもの で すませ ば 』 # ジブリ
ジコ 坊 : ふ ふっ 地バ シリ の 技 だ that ' s how they trick the boars もののけ姫 より # ジブリ # ghibli # 英語
飛べ ねぇ 豚 は ただ の チャーシュー だ # ラーメンマン 伝説 # ジブリ
もう 逃がさ ねえ ぞ that ' s as far as you go ! 紅の豚 より # ジブリ # ghibli # 英語
… ♬ それ は まるで 夢 の よう … # bot # 魔女の宅急便 # kiki # ジブリ
don ' t be such a sap ! バカヤロ   志 を もっと 大きく 持て # ジブリ # 紅の豚 # 英語 # 名言
親方 ー っ ! 空 から ラーメン が ー !! # ラーメンマン 伝説 # ジブリ
見つかっ ちゃう よ ! they ' ll find out i ' m a fake 魔女の宅急便 より # ジブリ # ghibli # 英語
… ♬ 時 を 越える たび 気づく ね 心 は 果てしなく て … # bot # 魔女の宅急便 # kiki # ジブリ
タイトル 組み合わせ 『 となり の 動く 豚 』 # ジブリ
我が 家族 は ややこしい 者 ばかり だ な 。 # ジブリ
♫ 突然 驚い た の … 胸 が ドキドキ し てる … # bot # 魔女の宅急便 # kiki # ジブリ

--- クラスタ3 ---
必ず 行く から 未来 で 待っ て い て !( ソフィー )  # ジブリ  # アニメ  # 名言

--- クラスタ4 ---
here is my garden , which everyone fears and does not approach . / ここ は 、 みな 恐れ て 近寄ら ぬ 私 の 庭 だ ( エボシ / もののけ姫 ) # ジブリ

--- クラスタ5 ---
「 サン は 森 で 、 私 は タタラ 場 で 暮らそ う 。 共に 生きよう 。 会い に 行く よ 、 ヤックル に 乗っ て 。 」 ( アシタカ )  # ジブリ  # アニメ  # 名言

--- クラスタ6 ---
あの 子 を 解き放て ! あの 子 は 人間 だ ぞ !- アシタカ ( もののけ姫 ) # ジブリ

--- クラスタ7 ---
いやいや 、 見つかっ て よかっ た 。 はぁ … はぁ … 。 こちら に 入る 時 に 落とし て しまっ た よう で … 御 家来 様 の 重量 オーバー の せい です ニャー ↑ ↑ # ジブリ

--- クラスタ8 ---
there is a demon within you. within this girl as well . / そなた の 中 に は 夜叉 が いる 。 この 娘 の 中 に も だ 。 ( アシタカ / もののけ姫 ) # ジブリ

--- クラスタ9 ---
この まま ひき さ が れる かい 。 すぐ 出発 だ ! ! # ジブリ

--- クラスタ10 ---
あの 女 の ため に 残し て おい た 力 な のに ! ( 「 もののけ姫 」 モロ )     # ジブリ  # アニメ  # 名言