ホーム > サーチエンジン

サーチエンジン

きざしカンパニーが提供しているサービスのコア技術である『時系列共起パターン解析エンジン(kizasiサーチエンジン) 』は、株式会社シーエーシーの技術研究センターが独自に研究開発しました。この解析エンジンでは、時間情報を持ったテキストデータ(例、ブログ、ニュース、掲示板、SNS、etc)を収集・言語処理・解析をすることが可能です。

例えば、kizasi.jpではブログをデータソースに、ある時間に話題になった言葉をkizasi語として抽出し、また、話題と関連性の高いニュースを抽出して表示しています。このように、テキストとテキストの関連性を計ることができるのも、kizasiサーチエンジンの特徴です。

kizasiサーチエンジンの主な特徴は以下になります。

話題解析 〜概念の変化を俯瞰する〜

時間情報をもつテキスト集合を対象として検索語の周辺文脈を解析し、語の関連性を時系列分析できます。このため、語を単語としてではなく、関連することばの集合(=概念)として捉え、時間軸の中での変化を俯瞰することが可能です。

準実時間のインデクシング 〜今、この瞬間の話題を発見する〜

クローリングからインデクシングまでの処理をパイプライン化し、時間とともに増加するテキストデータを準実時間で解析できます。その結果、今、この瞬間の話題の傾向を発見し、情報空間をサマライズすることが可能です。

関連性計測 〜言葉と話題を結びつける〜

上記の話題と、任意のテキスト情報の関連性を計ることが可能です。その結果、オントロジー(概念辞書)との連携や、ニュース記事とのマッチングが可能です。

傾向分析 〜集団の傾向を見出す〜

ブログをデータソースにすることで、集団の傾向やライフスタイルを分析することが可能です。特定の傾向を持った集団の話題を分析できます。

kizasiエンジン概念図