研究例紹介:山本研究室

お知らせ

    音声コミュニケーション情報処理技術の研究・開発

    音声は人間同士のコミュニケーションとして最も基本的な手段です。

    最近の音声認識技術の発展で、スマートフォンでの音声入力が手軽に使えるようになってきましたが、人間同士の対話のような複雑な音声コミュニケーションの実現のためには、多くの課題が残されています。

    本研究室では、音声を中心とした音声コミュニケーションに関連するさまざまな情報処理技術の研究開発を行います。

    様々な研究テーマ

    • より使いやすい・使って楽しい音声対話インタフェース(雑談対話システムの開発。感情を考慮した音声対話)
    • 講義コンテンツの音声認識・機械翻訳による自動字幕化および音声翻訳(合成音声により翻訳音声を生成)
    • 人間の自然な発話を高速・高精度に認識する大語彙連続音声認識システム(人間の聴覚特性の考慮、Deep Learningによる高精度化、GPGPUの活用による計算の高速化等)
    • 実環境における雑音・残響に頑健な音声処理技術や環境音認識(マイクロホンアレイ応用等)
    • 位相情報を用いた話者認識技術の高精度化およびスプーフィング(話者認証装置を騙す技術)への対策
    • 音楽情報処理に関する研究(音楽と歌声の分離、歌手認識、歌詞認識)

    自動翻訳字幕生成

    人間は音声によってさまざまな情報交換を行っています。「音声対話システム」ではコンピュータと音声で情報交換しますこれまでは、ホテル予約システムやチケット予約システム等の「目的が明確な対話を行うシステム」が開発されてきました現在、「目的を持たない対話(雑談対話)」に関する研究が注目されていて、人工知能(AI)研究が重要な要素になっています

    自動翻訳字幕生成

    海外の大学の講義がインターネットで公開されていますが、英語なので内容がよく分からないことが多いです。音声認識技術と機械翻訳技術により自動的に字幕を生成します

    講義コンテンツブラウザ

    • 自動音声認識・自動要約等の技術を統合して作成した、自習システムです
    • 講義の要点に関する部分を探し出して、そこにジャンプすることができるので、素早く講義の復習ができます
    • 講義映像とスライドデータから、半自動的に教材を作成できます

    英語学習システム

    先生なしで英語の発音・リスニングのトレーニングができます