原创 日常 从搜狗问问上扒数据 简单计算了下,扒了10多万的数据下来了 1条记录大概有10KB. 10多万数据从2007-05开始,000 当然这里的是理想状态我乱算的。 2016-11-11 浏览(861) 评论(0) 阅读全文
原创 日常 说说重要的贝叶斯公式吧 例如P(A)一般叫做先验概率,P(B|A)叫做似然概率,而P(A|B)叫做后验概率. 下面我通过两个例子来说明贝叶斯思想的有趣应用. 举例1:就是求P(碗1|曲奇)的数值是多少.那么根据贝叶斯公式,我们知道P(碗1|曲奇)=P(曲奇|碗1)*P(碗1)/P(曲奇),因此P(碗1|曲奇)=3/4*1/2/5/8=3/5, 2016-06-10 浏览(1,002) 评论(0) 阅读全文
原创 日常 聊聊语音识别的发展历程 语音识别还是基于传统的机器学习算法,如混合高斯分布(GMM)拟合以及隐马尔科夫模型(HMM)对音标状态进行推测.但是基于这类算法实现的语音识别系统精确度不够高,加上2006年Hinto提出了一种新型的神经网络训练算法使得深度学习死灰复燃.而深度学习主要是基于神经网络,通过构造多层神经网络来实现对输入数据进行得到较好的抽象的特征分布.当然, 2016-06-09 浏览(1,094) 评论(0) 阅读全文