Watson Discovery の試行レポートは Web を探してもほとんど見当たらない。
データを解析するという点では Watson Discovery こそが使用することに
なるはずなのであるがチャットボットとか音声認識とかおもちゃのような
サンプルばかりが目立っている。
そこで実際に弊社製品マニュアル HTML を文書に分割してアップロードの上
FAQ として問い合わせてどのような回答になるかをいろいろと試してみた。
Watson からの回答は JSON または HTML の両方について
回答を得てみた。検索の対象は HTML である。
その結果であるが
HTML の Pre タグが激しく壊れている。
- Pre タグのスペースがすべて 1 桁のスペースになってしまっている。
- Pre タグの改行コードがすべてスペースになってしまっていて改行されない。
- 不要な部分が改行されてしまっている。
などの症状があり結果の回答は正しいフォームで表示することができなかった。
日本語の文書は回答されているのだが表現のスタイルが相当、崩れているので
読みづらいだけでなく意味を読み取ることもできない回答となってしまっている。
これではとても製品には使えない。
Watson が文字コードなどをスペースにしてしまうので
受取り側で回復修正の方法がないのである。
この件については現在、回復方法があるのかを IBM に問い合わせてみた。
HTML での回答を一度でもテストすればわかる話なのだが
IBM 米国本社からは
- 質問は英文で
- 障害の具体的なサンプルが欲しい
との回答があった。( もちろん英文で )
IBM からの回答には期待していたのだがこれでは
外注任せでテストも十分せずにリリースしているように見える。
( テストすればすぐにわかるような大きなバグなので )
株式会社オフィスクアトロでは社内の技術で Watson から得られる回答に基づいて
本体のコンテンツを検索して製品として画像も含めて十分わかりやすく
美しく体裁も整えることに成功した。