本文とサイドメニューへジャンプするためのナビゲーションスキップです。

スタートアップガイド

J-Net21 中小企業ビジネス支援サイト

  • J-Net21とは
  • スタートアップガイド
中小機構
  • メルマガ登録
  • RSS一覧
  • お問い合わせ

HOME > 製品・技術を開発する > デジ・ステーション

デジ・ステーション


5分でわかる最新キーワード解説
Web風評検知システムってなんだ?!

日々進歩するIT技術は、ともすると取り残されてしまいそうな勢いで進化の速度を高めています。そこでキーマンズネット編集部がお届けするのが「5分でわかる最新キーワード解説」。このコーナーを読めば、最新IT事情がスラスラ読み解けるようになることうけあい。忙しいアナタもサラっと読めてタメになる、そんなコーナーを目指します。今回のテーマは「Web風評検知システム」。使ってビックリ!アナタの部長が内部告発されている裏企業サイトが見つかるかも?!

告発・中傷・デマ情報をすぐに発見!「Web風評検知システム」とは?

Web風評検知システムとは、Web上の掲示板、ブログ、SNSなどに書き込まれる企業や製品に関する風評情報(苦情、中傷、デマ、内部告発など)をリアルタイムに検知するための技術で、富士通研究所と富士通研究開発中心有限公司(中国)が開発した。この技術により、Web上の風評リスクへの対策を迅速に行うことが可能になる。例えば、社長や部長といった役職者が実名で告発や中傷されていたり、製品に対する間違った情報が流されていたりといった情報をいち早く掴むことができるのだ。
 今回開発された技術は図1のような仕組みになっていて、大量の風評パターンを一括して高速検知できるようになっている。風評パターンは、任意文字(ワイルドカード)を指定したり、文字間隔を指定したりすることも可能で、従来の検知技術では高速処理が難しかった複雑な風評パターンでも、性能を落とすことなく高速に検知できる。

図1 Web風評検知システム

資料提供:富士通研究所

ここで、風評パターンについて説明しておくと、これは以下のような風評に関する言葉の組み合わせパターンのことを指す。

  • 風評の有無を知りたい企業名または製品名など。
  • 風評を表現する言葉(風評語)で「苦情」や「故障」など。

簡単な風評パターンの例を挙げてみると、たとえば同一記事に「B商事」と「苦情」がともに出現するパターン、あるいは同一記事に「C社」と「パソコン」と「故障」がともに出現するパターンなどがある。風評語は1万語ほど存在するため、風評を漏れなく正確に検知したい場合には、数十万件以上の大量かつ複雑な風評パターンを指定しなければならない。参考までに、複雑な風評パターンの例を図2に紹介しよう。図2の左側のような記事がWeb上で公開された場合、この記事をWeb風評検知システムで見つけ出すには、右側に示すような風評パターンを指定する必要がある。

図2 複雑な風評パターンの例

資料提供:富士通研究所

「Web風評検知システム」を開発した理由

Web上における風評は、不特定多数の人々に即座に伝播することから、風評に対する対応が遅れると、予想外の甚大な企業ダメージを被る恐れがある。つまり、Web上の風評をいかに迅速に検知するかが、風評リスク管理における最重要課題の1つになりつつある。こうした状況の中、Web上の風評を検知する仕組みとして、数年前からCGM (Consumer Generated Media)分析サービスを利用した風評検知サービスや評判分析サービスなどが提供されるようになった。
 こうした従来のサービスの多くは図3のような仕組みで動作している。図3を見ればわかるように、従来の風評検知サービスでは、収集したデータを分析するために、必ずインデックス生成などの前処理が必要になることから、風評が書き込まれてから検知するまで、場合によっては1日以上かかってしまうことがある。また、風評を漏れなく検知するには、風評の有無を知りたい企業名や製品名と、風評を表現する「苦情」や「故障」といった言葉を複雑に組み合わせた大量の風評パターンを使用しなければならないが、従来の風評検知サービスでは、風評パターンの数が増えると検知時間も増大してしまう。従って、数十万を越える大量かつ複雑な風評パターンを指定した場合には高速検知が困難になり、大抵の場合、一度に検知できる風評パターン数に制限が設けられている。企業の風評リスク対策を迅速かつ的確に行うために、Web上の風評記事をリアルタイムで検知できる新しい技術の開発が求められていたのである。

図3 前処理が必要な従来の風評検知サービス

資料提供:富士通研究所

そこで、今回開発されたWeb風評検知システムには、次の2つの特長がある。まず、1つ目は従来行われていたインデックス生成を行わないことで、リアルタイム検知を可能にしている点だ(図4)。Web上に次々と書き込まれる記事を収集したら、前処理なしで即座に検知処理が適用され、登録された風評パターンにマッチした記事がリアルタイムで検知される仕組みになっている。従って、風評が書き込まれてから検知するまでに要する時間を大幅に短縮することができるようになった。

図4 新しいWeb風評検知システムでは前処理を行わない

資料提供:富士通研究所

2つ目の特長は大量の風評記事を一括で検知できるという点だ。風評語の検知処理のために、あらたに開発した独自のパターンマッチングアルゴリズムを採用することで、10万件以上の大量かつ複雑な風評パターンに対しても、検知速度を落とすことなく高速に検知できるようになった。具体的には、10万件の風評パターンに対して、Web記事1件あたり0.1ミリ秒未満のリアルタイムで検知できることが確認されている(Intel Xeon 3.8GHzマシン使用時)。また、風評パターン数を1件から10万件まで増やした場合の性能劣化は0.2%未満であることも確認されていて、検知速度は風評パターン数に依存せずほぼ一定である。

「Web風評検知システム」実用化への道のり

国内のブログは、現在1日60万ページから70万ページほどのペースで記事が公開されていることから、今回開発されたWeb風評検知システムを使えば、ほぼリタルタイムでブログを中心とした風評情報を検知できることになる。また、将来的にたとえ検知処理速度が不足してきたとしても、スケールアウトで簡単に処理性能を強化できるので心配はない。従って、あとはこの技術をどんな形で市場に提供していくかということになるが、すでに中国で提供されている富士通(中国)信息系統有限公司(FCH)のCGM評判解析サービスに対して、今年度中に本技術を適用する予定だ。現在提供中のCGM評判解析サービスにおいても、大量のWebコンテンツから評判情報を分析する機能が提供されているが、そのリアルタイム性能がより強化され、企業のブランドイメージを損なう記事が発信されてから、そのアラーム情報を企業に通知するまでの時間をさらに短縮できるという。
 このほか、富士通研究所では、風評パターンの作成ノウハウを蓄積しながら、風評情報のインフルエンサー(多数の人に大きな影響を与えるCGMの作成者)の早期発見、スパムブログの発見、Web上の犯罪予告検知への応用、食の安全、教育現場における闇サイト問題といったリスクマネジメントを中心に、その応用範囲を拡大していく予定だ。

取材協力 : 富士通株式会社、株式会社富士通研究所

掲載日:2009年4月15日

キーマンズネット

出典元:株式会社リクルート キーマンズネット 2009年03月04日掲載分

検索

このページの先頭へ