中部大学

中部大学

教員情報

山本 一公 YAMAMOTO Kazumasa

プロフィール

生年 1972
出身 岡山県美作市
職名 准教授
所属 工学部 情報工学科
大学院 工学研究科 情報工学専攻
最終学歴 豊橋技術科学大学大学院工学研究科
学位 博士(工学)(豊橋技術科学大学)
所属学会・役職 日本音響学会(ASJ)
電子情報通信学会(IEICE)
情報処理学会 (IPSJ)
The Institute of Electrical and Electronics Engineers, Inc. (IEEE)
International Speech Communication Association (ISCA)
Asia-Pacific Signal and Information Processing Association (APSIPA)
専門分野 音声言語情報処理、音信号処理
研究テーマ 自然な音声対話システムの開発、実環境音声認識、音響イベント検出、音声感情認識
研究紹介PDF
授業科目 計算機アーキテクチャ、情報技術者演習、C言語基礎
共同研究キーワード 音声処理、言語処理、音信号処理

学術論文、評論

"話者クラスタリングに基づく短時間発話音声認識.", 電子情報通信学会論文誌, Vol.J100-D, No.1, pp.81-92, Jan. 2017.

"複数の対話エージェントを用いた雑談指向の音声対話システム.", 電子情報通信学会論文誌, Vol.J99-D, No.2, pp.188-200, Feb. 2016.

"Single-channel dereverberation by feature mapping using cascade neural networks for robust distant speaker identification and speech recognition.", EURASIP Journal on Audio, Speech, and Music Processing, 2014:13 (31 pages), Jan. 2014.

"A Robust/Fast Spoken Term Detection Method based on a Syllable n-gram Index with a Distance Metric.", Speech Communication, Vol.55, No.3, pp.470-485, Mar. 2013.

"Hidden conditional neural fields for continuous phoneme speech recognition.", IEICE Transactions on Information and Systems, Vol.E95-D, No.8, pp.2094-2104, Aug. 2012.

"Improving the readability of ASR results for lectures using multiple hypotheses and sentence-level knowledge.", IEICE Transactions on Information and Systems, Vol.E95-D, No.4, pp.1101-1114, Apr. 2012.

"複数理解候補の保持と効率性・自然性を考慮した応答生成による誤認識に頑健な音声対話戦略とその評価.", 電子情報通信学会論文誌, Vol.J95-D, No.4, pp.982-994, Apr. 2012.

"CENSREC-4: An evaluation framework for distant-talking speech recognition in reverberant environments.", Acoustical Science and Technology, Technical Report, Vol.32, No.5, pp.201-210, Sep. 2011.

"Auditory perception versus automatic estimation of location and orientation of an acoustic source in a real environment.", Acoustical Science and Technology, Vol.31, No.5, pp.309-319, Sep. 2010.

"Speaker recognition by combining MFCC and phase information in noisy conditions.", IEICE Transactions on Information and Systems, Vol.E93-D, No.9, pp.2397-2406, Sep. 2010.

"Distant speech recognition using a microphone array network.", IEICE Transactions on Information and Systems, Vol.E93-D, No.9, pp.2451-2462, Sep. 2010.

"Privacy protection for speech signals.", Procedia - Social and Behavioral Sciences, Vol.2, No.1, pp.153-160, Mar. 2010.

"重要文抽出に基づく講義音声の自動要約.", 情報処理学会論文誌, Vol.51, No.3, pp.1094-1106, Mar. 2010.

"Privacy protection for speech information.", Journal of Information Assurance and Security (JIAS), Vol.5, No.1, pp.284-292, Jan./Feb. 2010.

"Automatic estimation of position and orientation of an acoustic source by a microphone array network.", Journal of Acoustical Society of America, Vol.126, No.6, pp.3084-3094, Dec. 2009.

"CENSREC-1-C: An evaluation framework for voice activity detection under noisy environments.", Acoustical Science and Technology, Technical Report, Vol.30, No.5, pp.363-371, Sep. 2009.

"日本語講義コンテンツコーパスの作成と分析.", 情報処理学会論文誌, Vol.50, No.2, pp.448-459, Feb. 2009.

"Mel-Wiener filter for Mel-LPC based speech recognition.", IEICE Transactions on Information and Systems, Vol.E90-D, No.6, pp.935-942, Jun. 2007.

"Development of an experimental noise annoyance meter.", Acta Acustica united with Acustica, Vol.93, No.1, pp.73-83, Jan./Feb. 2007.

"AURORA-2J: An evaluation framework for Japanese noisy speech recognition.", IEICE Transactions on Information and Systems, Vol.E88-D, No.3, pp.535-544, Mar. 2005.

"セグメント単位入力HMMによる雑音環境下での音声認識.", 電子情報通信学会論文誌, Vol.J83-D-II, No.12, pp.2526-2535, Dec. 2000.

"発話スタイルによる話速・音韻間距離・ゆう度の違いと音声認識性能の関係.", 電子情報通信学会論文誌, Vol.J83-D-II, No.11, pp.2438-2447, Nov. 2000.

"HMMに基づく音声認識のための音節モデルとtriphoneモデルの比較.", 電子情報通信学会論文誌, Vol.J83-D-II, No.6, pp.1412-1421, Jun. 2000.

"セグメント統計量を用いた隠れマルコフモデルによる音声認識.", 電子情報通信学会論文誌, Vol.J79-D-II, No.12, pp.2032-2038, Dec. 1996.

講演、シンポジウム、学会発表

国際会議(査読有り)

"Automatic explanation spot estimation method targeted at text and figures in lecture slides.", Proc. INTERSPEECH 2017, pp.2764-2768, Sep. 2017.

"A deep neural network integrated with filterbank learning for speech recognition.", Proc. ICASSP 2017, pp.5480-5484, Mar. 2017.

"Lyric recognition in monophonic singing using pitch-dependent DNN.", Proc. ICASSP 2017, pp.326-330, Mar. 2017.

"Robust lecture speech translation for speech misrecognition and its rescoring effect from multiple candidates.", Proc. ICAICTA 2017, 6 pages, Aug. 2017.

"Investigation of glottal features and annotation procedures for speech emotion recognition.", Proc. APSIPA ASC 2016, 4 pages, Dec. 2016.

"Domain adaptation of a speech translation system for lectures by utilizing frequently appearing parallel phrases in-domain,” Proc. APSIPA ASC 2016, 4 pages, Dec. 2016.

"Effect of sympathetic relation and unsympathetic relation in multi-agent spoken dialogue system.", Proc. ICAICTA 2016, 6 pages, Aug. 2016.

"Speech analysis of sung-speech and lyric recognition in monophonic singing.", Proc. ICASSP 2016, pp.271-275, Mar. 2016.

"Combination of syllable based n-gram search and word search for spoken term detection through spoken queries and IV/OOV classification.", Proc. ASRU 2015, pp.200-206, Dec. 2015.

"Speech recognition for mixed speech and music by NMF using various cost functions and noise adaptive training methods.", Proc. APSIPA ASC 2015, pp.27-30, Dec. 2015.

"Deep neural network based acoustic model using speaker-class information for short time utterance.", Proc. APSIPA ASC 2015, pp.1222-1225, Dec. 2015.

"Robust speech recognition using DNN-HMM acoustic model combining noise-aware training with spectral subtraction.", Proc. INTERSPEECH 2015, pp.2849-2853, Sep. 2015.

"English to Japanese spoken lecture translation system by using DNN-HMM and phrase-based SMT.", Proc. ICAICTA 2015, 6 pages, Aug. 2015.

"Speech recognition based on Itakura-Saito divergence and dynamics / sparseness constraints from mixed sound of speech and music by non-negative matrix factorization.", Proc. INTERSPEECH 2014, pp.2749-2753, Sep. 2014.

"Comparison of syllable-based and phoneme-based DNN-HMM in Japanese speech recognition.", Proc. ICAICTA 2014, pp.249-254, Aug. 2014.

"Single channel dereverberation method in log-Mel spectral domain using limited stereo data for distant speaker identification.", Proc. APSIPA ASC 2013, 4 pages, Oct. 2013.

"Fast NMF based approach and VQ based approach using MFCC distance measure for speech recognition from mixed sound.", Proc. APSIPA ASC 2013, 4 pages, Oct. 2013.

"Development and evaluation of spoken dialog system with one agent and two agents.", Proc. INTERSPEECH 2013, pp.1896-1900, Aug. 2013.

"Chat-like spoken dialog system for a multi-party dialog incorporating two agents and a user.", Proc. iHAI 2013, 8 pages, Aug. 2013.

"Speaker tracking with spherical microphone arrays.", Proc. ICASSP 2013, pp.3981-3985, May 2013.

国内学会・研究会

"大規模データベース CSJ を用いた DNN に基づくフィルタバンク学習の評価とフィルタ関数の比較.", 日本音響学会2017年秋季研究発表会, Sep. 2017.

"DNNに基づくフィルタバンクの再学習による話者クラス適応の検討.", 日本音響学会2017年春季研究発表会, Mar. 2017.

"音声感情のコンテキスト情報を考慮したラベリングと認識手法の検討.", 日本音響学会2017年春季研究発表会, Mar. 2017.

"ドメイン間遷移を持つ雑談音声対話システムの検討.", 日本音響学会2017年春季研究発表会, Mar. 2017.

"音声認識誤りを考慮した英語講義音声の日本語への音声翻訳システムの検討.", 言語処理学会第23回年次大会, Mar. 2017.

"講義スライド中の文章・図表を対象とする説明箇所自動推定手法の検討.", 日本音響学会2017年春季研究発表会, Mar. 2017.

"英日講義音声翻訳に対する音声認識誤りを考慮したパラレルコーパスの利用.", 第18回音声言語シンポジウム, Dec. 2016

"音声認識のためのDNNに基づくフィルタバンクの学習の検討.", 日本音響学会2016年秋季研究発表会, Sep. 2016.

"基底ベクトルの共有化に基づくNMFによるオーバラップ音響イベントの検出.", 音学シンポジウム2016, May 2016

"対象ドメインの高頻出句に対する人手対訳追加による講義音声翻訳の検討.", 情報処理学会音声言語情報処理研究会, May 2016.

"畳み込みニューラルネットワークの教師なし逐次適応学習の検討.", 日本音響学会2016年春季研究発表会, Mar. 2016.

"オフィス環境における音響イベントのオーバーラップ区間でのイベント検出.", 日本音響学会2016年春季研究発表会, Mar. 2016.

"NMFによる任意の音楽重畳音声の認識.", 日本音響学会2016年春季研究発表会, Mar. 2016.

"歌声音声の特徴分析とピッチ特徴量を考慮した歌詞認識の検討.", 日本音響学会2016年春季研究発表会, Mar. 2016.

"NMFとRPCAの併用による伴奏あり歌声の歌詞認識.", 日本音響学会2016年春季研究発表会, Mar. 2016.

"対象ドメイン内高頻出句の対訳作成による講義音声翻訳の検討.", 日本音響学会2016年春季研究発表会, Mar. 2016.

"音声感情認識における声門特性に基づく特徴量の検討.", 日本音響学会2015年秋季研究発表会, Sep. 2015.

"マルチエージェント音声対話システムにおけるエージェント間の同調・対立の効果.", 日本音響学会2015年秋季研究発表会, Sep. 2015.

"単語情報に基づく雑談対話における破綻の検出の検討.", 情報処理学会音声言語情報処理研究会, May 2015.

"NMFと雑音適応学習に基づく音楽重畳音声認識に関する検討.", 日本音響学会2015年春季研究発表会, Mar. 2015.

"Noise-aware trainingとSSを併用したDNN-HMM音響モデルの雑音下音声認識の評価.", 日本音響学会2015年春季研究発表会, Mar. 2015.

"年齢性別クラスタリング情報を考慮したDNN-HMMによる音声認識の検討.", 日本音響学会2015年春季研究発表会, Mar. 2015.

"英語講義音声の認識と日本語への翻訳の検討.", 日本音響学会2015年春季研究発表会, Mar. 2015.

"音節N-gramおよび単語検索を組み合わせた音声クエリによる音声検索語検出手法の検討.", 日本音響学会2015年春季研究発表会, Mar. 2015.

"朗読音声から歌声音声への変換と話者適応を用いた歌詞認識の検討.", 日本音響学会2015年春季研究発表会, Mar. 2015.

"講義音声の前処理と2段階翻訳に基づく日英音声翻訳.", 情報処理学会音声言語情報処理研究会, Feb. 2015.

"朗読音声-歌声音声の特徴量変換と話者適応を用いた歌詞認識の性能向上の検討.", 情報処理学会音声言語情報処理研究会, Dec. 2014.

"年齢・性別に依存しないDNN-HMMによる音声認識法の検討.", 情報処理学会音声言語情報処理研究会, Dec. 2014.

"様々な適応化を用いた伴奏なし独唱の自動歌詞認識の検討.", 日本音響学会2014年秋季研究発表会, Sep. 2014.

"音節N-gramを用いた音声検索語検出におけるマッチング距離尺度の検討.", 日本音響学会2014年秋季研究発表会, Sep. 2014.

"NMFによる音楽重畳音声の音声認識の改善.", 日本音響学会2013年秋季研究発表会, Sep. 2013.

"音声対話システムの応答文における 合成音声と肉声の印象比較.", 日本音響学会2013年秋季研究発表会, Sep. 2013.

"音声対話インタフェースにおけるロボットエージェントの優位性の評価.", 情報処理学会音声言語情報処理研究会, Jul. 2013.

"少数のステレオデータに基づく特徴量変換による残響除去.", 電子情報通信学会音声研究会, Jun. 2013.

"距離付き音節nグラムインデックスを用いた音声入力による音声ドキュメントの検索語検出法の評価.", 第7回音声ドキュメント処理ワークショップ, Mar. 2013.

"複数の対話エージェントを用いた音声対話システムの分析と評価.", 情報処理学会音声言語情報処理研究会, Feb. 2013.

受賞

2015年度 電子情報通信学会 情報・システムソサイエティ査読功労賞

2012年度 電子情報通信学会 論文賞

ページの先頭へ

ホーム
訪問者別メニュー