#0x01 First Encounter, Again (2/2)
一夜が明ける。次の日がやってきた。昨日までとは何もかも勝手が違う、新しい非日常の、始まりの日だ。
少し遅めの朝九時にセットしたアラームで起きた僕は、昨日と同じようにリビングに据えてあるデスクトップの前に腰を据えた。
――さて、どうなったか。できれば捗々しい結果が出ていればいいが。
そんな気持ちで点けたモニタの上には、果たして仕掛けていたスクレイピングと解析の結果がまとめられ、レポートとして生成されていた。
分析エンジンはどうやら、収集されたデータの中から着目すべき価値のある何かを見つけ出すことができたらしい。それが、この出力からは読み取れた。
取り敢えず、第一関門は突破できたと言ってよいだろう。心中で安堵交じりに、小さくガッツポーズを取った。
ただそれも一瞬のこと、改めて気合を入れ直す。
なんとなれば現状の結果はあくまで、「スタートラインに立てた」という以上のものではないからだ。その中身を調べ、意味を見出し、次のアクションに繋げることができるかどうかは、もたらされたアウトプットの何たるかと、僕自身の腕にかかっている。
そういうわけで僕が始めに取り掛かったのは、得られた結果の全体像を俯瞰することだった。
レポートによれば、今回収集された莫大な、それこそ一千万オーダーのソースデータの中で、システムが関連度について閾値を越えたと示しているものは実に二万五千件を上回っている。
当然、人力でこれを調べていては時間がいくらあっても足りない。よってそこからもう一つ手を加える。
まずはDAの報告書にあった画像資料などから抽出した画像やテキストを特徴ベクトル化し、今回の各データを同様の手法で特徴化したものとのコサイン類似度を測る。その上位百件ほどのデータを対象にまた同様のコサイン類似度判定で関連データを抽出、これを再帰的に繰り返して、最終的には中心にDAのレポートを据えた形の、情報の依存関係を含めたデータのツリー構造を構築する。無秩序なデータの集積に上位下位と関連度の概念を持ち込んで、人力での解析を容易にすることが狙いだった。
当然に、その処理も実行するのはマシンだ。特徴ベクトルの算出には既存のモデルを使えばいい以上、困難なタスクというわけでもない。朝食を片手にその終わりを待てば、大体三十分ほどで結果が出てきた。
それによれば、列挙されているデータの中で有意に高関連度を示した情報は五十件ほど存在している。そしてそこに共通するラベルには、移動手段としての「白いバン」や、地理的情報としての「押上」、といったものが挙がっていた。
DAの報告書に記述されていた武器の取引現場と、地理としては照合できている。つまり彼らは場所に関しては正確な予測をしてみせたというわけだ。最低でも、観測事実からは高確度でそう推測できる。
ならば何が問題だったのか。その答えは、絞り込まれたレコードのタイムスタンプにあった。
[9]前話 [1]次 最初 最後 [5]目次 [3]栞
現在:1/16
[6]トップ/[8]マイページ
小説検索/ランキング
利用規約/FAQ/運営情報
取扱説明書/プライバシーポリシー
※下部メニューはPC版へのリンク