基于android平台的语音机器人服务娱乐系统

来源：互联网收集：自由互联发布时间：2023-02-04

分类号：TP311 学校代码：11460 学号：10130920 本科生毕业论文基于android平台的语音机器人服务娱乐系统 Robot Entertainment Service System Based on Android Platform 所在系（院）：学生：指导教师

分类号：TP311

学校代码：11460

学号：10130920

本科生毕业论文

基于android平台的语音机器人服务娱乐系统

Robot Entertainment Service System Based on Android Platform

所在系（院）：

学生：

指导教师：

研究起止日期：

学位论文独创性声明本人郑重声明：1. 坚持以“求实、创新”的科学精神从事论文写作工作。2. 本论文是我个人在导师指导下进行的研究工作和取得的研究成果。3. 本论文中除引文外，所有实验数据和有关材料均是自己研究完成。4. 本论文中除引文和致谢的内容外，本论文没有抄袭，剽窃他人已经发表的研究成果。

5. 其他同学和导师对本文研究所做的贡献均已在论文中作了声明并表示了谢意。

作者签名：刘倩2013年 4 月 15 日

基于android平台的语音机器人服务娱乐系统_机器人

摘要

随着科学技术的发展，人们已不再满足当前人机交换信息的方式，而希望能用自然语言直接进行信息传递，以便大大的提高人的工作效率，语音识别是建立计算机听觉系统的基础，而目前，很大一部分应用都是基于移动互联网技术，也是目前几年国家一直推崇发展的，而近几年移动平台上有关语音识别的应用非常火爆，国内有像挖财和UC浏览器等推出的语音输入和控制功能，在助手类应用中，语音识别更是作为一种必不可少的主流技术，比如现在主流的GPS语音导航系统，基于Android平台的语音播报器等，不仅能增强较完美的用户体验，还能给客户增加不少趣味性，但是目前基于安卓移动平台的机器人大多数都以文字输入形式和机器人进行沟通聊天，内容形式比较单一，缺乏趣味性，现在流行的simsimi小黄鸡中文版是一款运行在Android平台上的安卓手机聊天机器人，虽然拥有庞大的数据库，但是不支持语音聊天，不智能化，因为语音识别是近几年手机开发的主流，所以我想能够开发一款基于Android平台的语音机器人娱乐系统，能够语音和我们的机器人进行聊天，还可以通过语音进行天气的查询，它一样拥有庞大的数据库，而且会越来越智能，越聪明。

关键词：android；java；语音功能；智能；开源系统；数据库；

Abstract

With the development of science and technology, people are no longer satisfied with the current human ways to exchange information, hope can directlycommunicate with natural language, so as to greatly improve people's working efficiency, speech recognition is the foundation, est.ablishing computer auditory system at present, a large part of the application is based on mobile Internettechnology, is currently a few the state has always promoted development, in recent years, the mobile platform application on speech recognition is very hot,there are like the speech input and control function to dig property and a UC browser launched, in a helper class applications, speech recognition is anecessary mainstream technology, such as the current mainstream GPS voice navigation system based on the Android platform, voice broadcast device, can not only enhance the perfect user experience, can increase the number ofinterest to the customer, but the Android mobile platform robot most on text input form and robot communication based on content, form is single, lack of interest,Chinese version of simsimi chicken is popular now a run on the Android platformAndroid mobile phone chat robot, though With a large data.base, but does not support the voice chat, not intelligence, because speech recognition is the mainstream of the mobile phone development in recent years, so I want to be able to develop a speech robot entertainment system based on Android platform,capable of speech and our robot to chat, also can be the weather by voicequery, it has the same the large data.base, and will be more and more intelligent,more clever.

Key Words: Android;java; SQLite data.base; SQLite data.base; open source system; smart; Voice function;

1 绪论

1.1 研究背景及现状

早在计算机发明之前，自动语音识别的设想就已经被提上了议事日程，早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的"Radio Rex"玩具狗可能是最早的语音识别器，当这只狗的名字被呼唤的时候，它能够从底座上弹出来，这就是第一代语音机器人的诞生。

随着现代技术的发展，人们对移动终端的依赖性和期望是越来越大。短信发送，语音通讯，手机小游戏等都已经无法满足人们对移动终端的需求，这些移动终端也开始失去了市场。人们现在都想要各种机器能听懂人类的语言，并且能做到人说什么，机器就会按照人说的话，去执行命令，从而实现人机的语言交流。随着计算机科技的发展，人们的这一想法终于可以实现，这是由于语音识别技术的出现，使得机器通过识别和理解，然后把人的语音信号转变成机器相对应的命令。语音识别技术的应用已经成为当今社会上具有竞争价值的新兴高科技加高技术的产业。它在人机交互中占的比列将会越来越大。所以本课题的研究也正是致力于开发出一款基于android手机平台的语音娱乐服务机器人，除了可以正常的和用户进行语音交流外，还可以实现一些用户生活上的帮助功能，来满足用户的使用和需求，比如查询天气等。

1.2语音识别基本原理

语音识别过程与人对语音识别处理的过程基本上是一致的。它实际上是一种模式识别系统，和常规的模式系统一样，有特征提取、模式匹配、参考模式库等三个基本单元。

语音识别系统的基本结构如图1-1所示。它分为三个步骤：

（1）前端处理：从语音信号中提取有效的特征参数来代表语音特征，具有很好的区分性。

（2）声学模型与模式匹配：声学模型通常将获取的语音特征通过学习算法产生，在识别时将输入的语音特征与声学模型进行匹配与比较，得到最佳的识别结果。[5]

（3）语言处理：语言处理可以进行语法、语义分析，通过最好有高效的算法，保证语音识别的实现。

图1-1语音识别的原理框图

Android手机上实现语音识别的原理：android手机先将用户语音输入的信号，送至科大讯飞的云端，借助于云端技术可以识别用户的语音输入，云端搜索完毕后，将返回打印数据。

1.3科大讯飞介绍

科大讯飞作为中国最大的智能语音技术提供商，在智能语音技术领域有着长期的研究积累，并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。基于拥有自主知识产权的世界领先智能语音技术，科大讯飞已推出从大型电信级应用到小型嵌入式应用，从电信、金融等行业到企业和家庭用户，从PC到手机到MP3/MP4/PMP和玩具，能够满足不同应用环境的多种产品。科大讯飞占有中文语音技术市场70%以上市场份额，语音合成产品市场份额达到70%以上，在电信、金融、电力、社保等主流行业的份额更达80%以上，开发伙伴超过10000家，以讯飞为核心的中文语音产业链已初具规模。

要实现语音机器人的对话功能，必须要用到一下两种技术

语音合成技术

语音合成和语音识别技术是实现人机语音通信，建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力，是当今时代信息产业的重要竞争市场。和语音识别相比，语音合成的技术相对说来要成熟一些，并已开始向产业化方向成功迈进，大规模应用指日可待。

语音识别技术

自动语音识别技术(Auto Speech Recognize，简称ASR)所要解决的问题是让计算机能够“听懂”人类的语音，将语音中包含的文字信息“提取”出来。ASR技术在“能听会说”的智能计算机系统中扮演着重要角色，相当于给计算机系统安装上“耳朵”，使其具备“能听”的功能，进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。

2语音机器人服务娱乐系统的研究分析

本文系统设计采用的开发环境为Windows下的Google Android开发平台。

所需软件如下：

Eclipse 3.3.2

JAVA JDK SE 1.6

Google Android SDK

ADT

2.1市场可行性

随着现今科技技术的发展，3G技术的发展带来了3G手机的到来，基于Android操作系统的手机市场逐步发展壮大，愈来愈多的人开始选择谷歌的Android手机，因此这个市场的商业价值很高，所以我们选择了开发基于Android平台的语音识别应用系统。由于科学技术的不断发展，让各种机器能听懂人类的语言并能按人的命令来行动，从而实现了人类与机器的语言交流。而Android自带的语音功能却很少被开发和应用，没能给人们带来快捷和便利，正因为如此，我决定开发此语音机器人服务娱乐系统，不仅可以和机器人进行简单的聊天交流，同时还可以通过语音来查询天气，并且加入动画增加趣味性，因此我希望我的研发不仅可以成为人们生活的好伙伴，还可以作为儿童们的玩具，而目前正缺少这种带有趣味性，类似汤姆猫，功能也比较多的机器人服务娱乐系统了，它会让你觉得有一个真正的伙伴站你的面前，和你轻松交谈，所以从市场角度来看，十分有必要开发基于Android的机器人服务娱乐系统。

2.2研究目的

随着一批又一批的移动应用不断发布的今天，开发一个具有对话功能的语音机器人服务娱乐系统，会受到大部分小朋友，学生以及年轻上班族的青睐，并且该系统必须具备操作简单，功能俱全，可扩展性好，娱乐性丰富，不单一等特点，现在市场已经有类似的语音机器人，如汤姆猫等，但玩法大多比较单一，对话简单，而这款具有对话功能的语音机器人服务娱乐系统，玩法多样化，能真正的实现智能语音对话的功能，让它成为你工作，娱乐，生活中的好伙伴另外。通过此次设计，能够掌握android软件开发，掌握控件、数据库SQLite和多线程编程技术。能够在实践中了解语音识别技术，掌握android语音播报天气等功能，因为语音机器人可不断的完善的功能很多，所以可以涉及到很多android的应用功能，所以希望自己在程序开发的过程中，不断的总结错误，提高自己的实践能力。

2.3 Android介绍

Android是一种基于Linux的自由及开放源代码的操作系统，主要使用于移动设备，如智能手机和平板电脑，由Google公司和开放手机联盟领导及开发。尚未有统一中文名称，中国大陆地区较多人使用“安卓”或“安致”。

2.3.1 Android平台架构

基于android平台的语音机器人服务娱乐系统_Android_02

图2-1 Android的架构流程图

应用程序层（Applications）该层主要有移动终端常常自带的一些手机软件，如：email客户端，SMS 短消息程序，日历，地图，浏览器，联系人管理程序等。这些应用主要的开发语言是JAVA语言。因此使得熟悉JAVA开发的开发者，能很快的过渡到android系统软件的开发中。开发者开发的软件也是应用在该层上面。

应用程序框架 (Application Framework)开发人员通过API框架来了解核心应用技术。任何应用程序可以通过发布它的功能块同时任何其它的应用程序都能够使用其所发布的功能块（不过得遵循框架的安全性限制）。同样，任何应用程序重用机制都可以使用户方便的替换程序组件。隐藏在每个应用程序后面的是一系列的服务系统, 其中包括：视图（Views）——可以用来创建应用程序，它包括：列表（lists），文本框（text boxes），按钮（buttons），网格（grids）。内容提供器（Content Providers）——它使应用程序能够访问另一个应用程序的数据，或者分享他们已有的资源。资源管理器（Resource Manager）——提供了访问资源并且非代码的形式，例如图形，字符串，和一些布局文件（layout files）。活动管理器（Activity Manager）——专门管理一些程序的生命周期同时提供了常用的导航返回功能。通知管理器（Notification Manager）——它让应用程序在显示框中可以显示出自己定义的一些提示信息。

程序库（Libraries）Android 包含了C/C++库，这些程序库能被Android的系统不同的组件使用。这些组件可以通过Android的程序框架来为开发者提供已设置的服务。以下是已有的核心库：系统C库——一个继承了BSD而来的标准 C系统的函数库（libc），这是专门为基于嵌入式linux的设备而定制的。媒体库——该库支持了多种最常用的关于音频、视频的回放和录制，同时还支持静态的图像文件。编码格式包括MP3、JPG、AAC、PNG、AMR。Surface Manager——它是专门管理显示的子系统，而且应用程序还可以将2D和3D的图层的融合起来。SGL——底层2D的图形驱动引擎。3D libraries——图形库，该库使用了3D的硬件和软件加速。FreeType——位图和矢量，显示字体。SQLite——任何开发程序都能使用，功能非常好的轻型数据库。

Android 运行库层（Android Runtime）

Android中有自己的核心库，此核心库给予了大多数JAVA编程中的核心库拥有语言功能。所有Android开发程序都是自己在进程中各自运行，它们都有自己的虚拟机实例。JAVA虚拟机被专门设计成专有设备，它能够运行多个虚拟系统。

Android包含一个c/c++的集合，当开发者使用android应用程序架构时，android系统会通过这些集合来支持对开发者使用的各个组件，下面是一些库：

Surface Manager管理多个程序执行时候的相互存取和显示，同时也负责对2D与3D的绘图进行合成显示。
Media Framework中文是多媒体库，支持多种常用的视频，音频格式的播放和录制，比如：MPEG4、MP3、H.264、AAC、ARM等。
SQLite这是相对于Oracle、mysql、sqlserver等一些数据库还小的小型数据库，它是关系型数据引擎。
OpenGL|ES是根据OpenGL ES API的标准实现的3D绘图函数库。
FreeType提供矢量和位图。
WebKit

Web浏览引擎。

每个android应用程序都是采用Java语言编写的而且，它都运行在Dalvik虚拟机上，而Dalvik虚拟机只执行“.dex”的文件，Java程序通过编译时，还需要通过android的SDK中的“dx”工具将其转化为“.dex”的后缀文件，才能正常的运行。

Linux 内核（Linux kernel）

Android的核心系统的服务依是基于 Linux的内核，如安全性，内存管理，进程管理，网络的协议栈和驱动模型。

2.3.2 Android应用程序构成

对一个Android应用程序而言，一般是由下面4大组件构造而成：

Activity（活动）
Broadcast Receiver（广播接收器）
Service（服务）
Content Provider（内容提供器）

Activity应用程序的每个界面都将是Activity类的扩展。Acitvities用视图(View)构成GUI来显示信息、响应用户操作。就桌面开发而言，一个活动(Activity)相当于一个窗体(Form)。

Intent Receiver应用程序消息传递框架，它是各个组件之间的桥梁，它可以在给特定的服务传播消息来执行你的意图。

ServiceService组件在后台运行，更新你的数据源和可见的Activities，触发通知(Notification)。在应用程序的Activities不激活或不可见时，用于执行依然需要继续的长期处理。

Content Provider

Content Providers用于管理和共享应用程序数据库。是跨应用程序边界数据共享的优先方式。

2.4 Eclipse简介

Eclipse是一种可扩展的开放源代码IDE。2001年11月，IBM公司捐出价值4,000万美元的源代码组建了Eclipse联盟，并由该联盟负责这种工具的后续开发。集成开发环境(IDE)经常将其应用范围限定在“开发、构建和调试”的周期之中。为了帮助集成开发环境(IDE)克服目前的局限性，业界厂商合作创建了Eclipse平台。Eclipse允许在同一IDE中集成来自不同供应商的工具，并实现了工具之间的互操作性，从而显著改变了项目工作流程，使开发者可以专注在实际的嵌入式目标上。

Eclipse框架的这种灵活性来源于其扩展点。它们是在XML中定义的已知接口，并充当插件的耦合点。扩展点的范围包括从用在常规表述过滤器中的简单字符串，到一个Java类的描述。任何Eclipse插件定义的扩展点都能够被其它插件使用，反之，任何Eclipse插件也可以遵从其它插件定义的扩展点。除了解由扩展点定义的接口外，插件不知道它们通过扩展点提供的服务将如何被使用。

2.4.1 Eclipse的优点

Eclipse的最大特点是它能接受由Java开发者自己编写的开放源代码插件，这类似于微软公司的Visual Studio和Sun 微系统公司的NetBeans平台。Eclipse为工具开发商提供了更好的灵活性，使他们能更好地控制自己的软件技术。Eclipse 联盟已经宣布将在2004年中期发布其3.0版软件。这是一款非常受欢迎的java开发工具，这国内的用户越来越多，实际上实用它java开发人员是最多的。缺点就是较复杂，对初学者来说，理解起来比较困难。

3语音机器人服务娱乐系统的需求分析

3.1 功能需求

基于android平台的语音机器人服务娱乐系统，是通过语音与手机交换讲话娱乐的系统,通过系统能够输入对话的信息并语音阅读出来，实现了通过手机象对语音机器人一样讲话服务娱乐的功能。以下是语音识别应用系统具备的功能：

能够和机器人进语音进行聊天，可以由软件开发者修改数据库里的对话内容

设有语音查询天气功能

3.2 需求分析

在软件设计之前，我们需要做的就是在市场针对这一类型的软件进行调查，看是否能够满足于大部分人生活的需要，我们要做的工作就是对语音识别应用系统实现的流程、操作等做出详细的调查，从而了解系统需要实现的功能。系统在开发的过程中，经过了较长时间的设计阶段，需要不断的优化和完善，

4语音识别应用系统的设计及相关技术

4.1 功能框架

本系统旨在建立Android手机，主要有如下几个核心功能模块，如图4-1所示：

Android语音控制系统

图4.1 系统功能框架

功能选择

语音记事本

控制电灯

添加

删除

通过按钮控制电灯开关

通过语音控制电灯开关

添加标题

添加的内容存储到数据库中

删除对应在数据库的内容

图4-1 软件功能模块流程图

各个模块具体功能如下：

语音记事本：

添加模块点击menu后点击添加进入新的记事本，输入标题和添加记录内容，点击确定BUTTON，保存到数据库中

删除模块

点击menu后，点击删除按钮，即可删除记录

控制电灯：

按钮控制模块通过开/关Button,来控制灯的开关

语音控制模块

通过按下语音Button，当说开灯/关灯时来控制灯的开/关

4.2 系统实现流程图

启动模拟器后，首先进入的是登录界面，输入用户名和密码后，进入主界面，然后通过两个下面的Button来选择功能界面，并且进行不同的操作，整个流程如图4-2所示：

开始

主界面

功能选择

yes

说笑话

退出

查询地理位置

系统帮助

图4-2系统实现流程图

4.3 用户界面设计

用户登录界面用户登录界面是系统运行之后进入的第一个显示界面，用来完成用户的用户名和密码登录，确认以后进入主界面。

主界面一进入主界面通过按发音按钮，可以和语音机器人进行简单的语音聊天，可以通过发出“北京”等，查询各个城市的天气，并且由语音机器人进行语音播报通过一个BUTTON按钮，散开式样的风格进行不同的功能选择。说笑话，可以让机器人语音说笑话查询地址位置，当选择进入语音记事本后，将进入地理位置功能，将定位你目前的地理位置，自动播报你当前的所在位置。系统帮助界面，可以显示机器人服务娱乐系统的玩法。退出，退出系统4.4 数据存储设计数据存储方式。可分为：SharePreference、SQLite、Content Provider和File。作为一个完整的应用程序，数据存储操作是不能缺少的。因此，Android系统一共提供了四种数据存储方式。SQLite： SQLite是一个拥有强大功能的轻量级数据库，支持基本SQL语法，是常被使用的一种数据存储方式。Android为此数据库提供了一个名为SQLiteData.base的类，封装了一些操作数据库的API。SharedPreference：除了SQLite数据库以外，另一种经常被使用的数据存储方式，其本质就是一个xml文件，常用于存储较简单的参数设置。File：即常说的文件（I/O）存储方法，常用存储大数量的数据，但是缺点是在更新数据时效率低。ContentProvider: Android系统中用来实现所有应用程序共享的一种数据存储方式，由于数据通常在各自应用间的是互相私密的，因而此存储方式使用比较少，但是其又是必不可少的一种存储方式。例如音频，视频，通讯录，一般都可以使用此存储方式。每个Content Provider都会对外提供一个公共的URI，当有应用程序有数据需要共享时，就需要使用Content Provider为这些数据定义一个URI，之后其他的应用程序就可以通过Content Provider传入这个URI来对数据进行操作。本文使用了SQLite数据库来保存语音聊天的对话信息。系统保存了语音主人的问题和机器人的回答，通过SQLite数据库中的保存的主人问题和TTS返回的resultString进行模糊查询。如果匹配成功，则返回机器人的回答，机器人的回答就是SQLite里保存的constant.ANS字段，当然，实现这样一个语音对话需要解决一系列技术问题。比如谷歌的语音包是不支持中文的，为了很快的进行服务器的语音数据提取，目前最主流的语音包是来自科大讯飞的TTS语音包，支持中文，还有就是，数据库如何创建；该数据库包含哪些操作；接下来对数据库的一些操作性的问题做个简单的解答：

SQLite数据库如何创建？

解答：我们都知道Android编程用的也是Java语言，传统的数据库创建和操作是基于一块操作的，那么我们在做JAVA编程的时候就要很好地利用JAVA面向对象的特点，首先我们写一个初始化的类，用来进行数据库和数据表的初始化，创建一个类constants，这个类专门对数据库进行初始化。这样做的目的就是为了方便以后直接利用这个对象进行数据库的操作，这个类如图4-3所示：

基于android平台的语音机器人服务娱乐系统_语音识别_03

图4-3 数据库的操作类图

代码如下：

public class constants extends Activity{

//这里的代码很重要，用来进行数据库的初始化工作

public static final String DATA.BASE_NAME = "chat.db";

public static final int DATA.BASE_VERSION = 1;

public static final String CHAT_TA.BLE_NAME = "chat_ta.ble";//对话表名

public static final String ANS = "ans";//对话问题问题字段名

public static final String QUS= "qus";//对话答案答案字段名

public static SQLiteData.base db;

public static final int ACTIVITY_CREATE = 0;

public static final int ACTIVITY_EDIT = 1;

}

如上代码所示，创建一个constants类来初始化数据,在这里数据名为chat.db，数据表为chat_ta.ble,有两个字段ans(主人的问题)和qus（机器人的回答).

2.系统应用到的数据库主要就是查询，事先就应该将对话的数据全部写进去，在昨晚数据信息的初始化以后，下一步要做的就是继承SQLiteOpenHelper来创建数据库和数据表，在public void Oncreate(SQLiteData.base db)中进行数据添加，

代码如下：

public class DBHelper extends SQLiteOpenHelper {

public DBHelper(Context context) {

super(context, constants.DATA.BASE_NAME, null,

constants.DATA.BASE_VERSION);

}

@Override

public void onCreate(SQLiteData.base db) {

// TODO Auto-generated method stub

String sql = "CREATE TABLE " + constants.CHAT_TABLE_NAME + " ("

+ constants.QUS + " text not null, " + constants.ANS

+ " text not null " + ");";

Log.i("chenggong:createDB=", sql);

db.execSQL(sql);

String sql1 = "insert into " + constants.CHAT_TABLE_NAME + " ("

+ constants.QUS + ", " + constants.ANS + ") values('你好','你好');";

String sql2 = "insert into " + constants.CHAT_TABLE_NAME + " ("