手と目と声のコラボレーションを目指す
2つのカメラと2本の腕を持つロボットでタブレット端末への
描画・筆記を実現します。
2つのカメラでタブレット端末の位置姿勢を検出します。
一方の腕でタブレット端末を持ち、
もう一方の腕でタブレット端末へ書き込みを行います。
カメラからリアルタイムで位置姿勢を獲得し、
その情報を手の動作に反映します。
両手でなければできない作業をロボットにより実現します。
顔の目、鼻、口などの位置関係から図形的な特徴量を抽出します。
その特徴量から個人を特定し、
映像内に写っている複数の人物の顔を認識します。
特徴量の抽出や照合は高速なアルゴリズムで行っています。
前髪や眼鏡の装着により顔の一部が隠れる場合でも、
他の位置関係を利用することで認識ができます。
また、顔の内部のみを検出対象としているため、
背景部分や衣装にも影響されずに認識が可能です。
家庭用や学校などでの点呼の用途があります。
文字の読み取り技術は様々な知識収集に利用範囲が広がる可能性を秘めています。
書籍などに記された和文字を読み取ることに着目し,
カメラ画像から文字を認識する手法を提案しています。
書籍に記された文字はフォントによって形状が変わるので,
文字を図形として扱った文字認識を試みています。
スマートフォンアプリも開発中です。
楽譜に記された音符と歌詞を認識し,
リアルタイムで歌うことができるシステムの開発を行っています。
楽譜内の歌に関する情報(歌詞、音の高さ、長さなど)を取得し,
音声合成処理によって歌う処理を行っています。
すべての楽譜に対応できるように、また迫力のある歌声を披露できるように音声合成処理の研究も行っています。