[gooラボAPIに関する調査] API料はかからない。 応答は高速(ほぼ0秒) APIキーは全APIで共通

ひらがな化API ・アルファベットや数字も無理矢理ひらがなに変換する。 ・文脈に応じて、同じテキストでも変換が変わってくる。 ・出力例 line→らいん, api→あぴ, 123→いちにーさん, 123万→ひゃくにじゅうさんまん, 123,000→じゅうにまんさんぜん ・この特徴を活かすと、お題のテキストと出力テキストの両方をひらがな化して、完全一致すれば1ポイントにすると良さそう。 ・自動的に文節をスペースで分けているので、ひらがな化→スペース削除で完全一致判定 ・句読点やコロンなどの記号は基本的にひらがな化されないので、あまり気にしなくて良さそう。

テキスト類似度API ・20文字程度の短文から長文なら、ある程度良い感じ(あまりに短いと精度に難あり) ・ただの単語や短いフレーズだと、似た言葉でも類似度0.0になってしまう。 ・完全一致だと何故か1.0を少し超えるので例外処理が必要かも? ・短文×長文の類似度も上手く出力してくれる。 ・出力例 感謝します, ありがとうございます→0.0 ご苦労様でした, お疲れさまでした→0.0 今日は晴れだ, 今日は晴れている→0.918 彼の名前は田中太郎で、東京都に住んでいる。趣味は読書と映画鑑賞で、特にミステリー小説が好きだ。, 彼の名前は田中太郎で、彼の住まいは東京都。読書や映画鑑賞が彼の趣味で、ミステリー小説を特に好んでいる。 →0.956 今日のランチは寿司だ, 今日の夕食はラーメンだ→0.717 彼女は大阪出身で、現在は名古屋で働いている。彼女の趣味は旅行と音楽鑑賞だ。, 彼は名古屋生まれで、大阪での大学生活を経て東京で働くようになった。音楽と映画が彼の最も好きな娯楽だ。 →0.792 犬は人間の最良の友だ。, 私の好きな果物はリンゴだ。 →0.510 火力発電にはいくつかの問題点があります。 地球の気候変動は深刻な問題となっており、環境保護の取り組みが急募されている。温室効果ガスの削減や再生可能エネルギーの普及が重要だ。 →0.651

キーワード抽出API ・テキストのタイトルと内容からキーワードとその重要度を返してくれる。 ・抽出する最大キーワード数は指定できる(最大で10個まで)。 ・テキストペア類似度APIは、適当なプロンプトを送ってもある程度の類似度が出力されてしまうので、キーワードを含まなかった場合にこのAPIを使って減点すればちょうどよくなりそう。 ・減点する項は、キーワードの重要度で重みづけすると良さそう。