深度阅读的意义

深度阅读的意义,第1张

当前电子阅读本质上还是在延续传统纸质阅读时代的“浅阅读”(shallow reading)方式,无法满足人们对全面、关联、智能知识获取三方面的深入需求。主要体现在:
1 知识点覆盖面不全。浅阅读的知识源局限于书籍本身。当读者遇到陌生的概念或者感兴趣的知识点需要进行扩展阅读时,需要借助书籍之外的工具,比如词典、搜索引擎等。
2 知识点之间缺乏语义关联。学习的重要机制之一就是联想。建立知识点之间的语义关联是辅助学习的关键。浅阅读模式下,知识点大都是孤立,缺乏有效地机制和技术手段进行语义关联。
3无法支持智能知识获取。智能知识获取体现在理解书籍内容和用户阅读行为的前提下,实现个性化只是推荐和具备情景感知能力的知识推荐,从而降低读者知识获取的代价。浅阅读模式尚不具备上述功能。人们为了获取某个知识点需要借助大量的辅助阅读工具,并从海量信息源中做出艰难的选择。
为了克服浅阅读的缺点,满足人们的全面知识获取、关联知识获取、智能知识获取三方面的深入阅读需求,我们需要一种全新的阅读模式——深度阅读。
人在阅读的时候,书籍也在“读”人 ,书籍可以记录读者的阅读习惯与阅读水平自动的向读者提供个性化的阅读服务与知识推荐,从而实现智能阅读。
文化建设和社会发展需求 知识服务的需求 人的认知能力是有限的,阅读时总会遇到生僻的概念或者专业术语,此时读者往往需要花费大量的精力查阅资料,甚至需要查阅多种信息资源并进行知识整合才能对指定概念有全方位和深入的认识。因此,为了减少大量的信息检索而获得最直接的知识(问题的准确答案,概念的准确解释),我们需要一种全新的知识服务模式。基于中文知识图谱的深度阅读将知识集成到电子书籍中,很大程度上提高了书籍的可理解性,知识获取的直接性和全面性。 知识图谱构建的需求 为了得到全面、直接的知识,我们需要一个具有语义理解能力和知识描述能力的平台。搜索引擎的出现实现了知识搜索从数据变到信息的跨越,即从海量网页数据中提取相关的信息反馈给用户。而知识图谱的出现则实现了搜索直接通向答案本身,用户提交需求后得到的就是最准确的知识,知识图谱就是知识的提供者。因此,我们需要建立面向阅读领域的知识图谱,并利用知识图谱知识聚合、知识分析推理、知识图谱演化分析、知识导航等手段,满足读者精确查询、模糊检索、智能搜索、关联推荐、深度阅读等需求。

Sophon KG
星环知识图谱软件(Sophon KG)是一站式知识全生命周期的管理平台,是一款集知识的建模、抽取、融合、存储、计算、推理以及应用为一体的知识图谱产品。本平台支持低代码图谱构建、智能化知识抽取、多模态知识存储、分布式图计算以及多维度的图谱分析。

星环科技在推动知识图谱技术创新和成功落地的过程中,获得了多项荣誉和权威认可,发挥了重要的引领者作用。星环科技知识图谱平台曾入围Gartner 2022《Market Guide for Artificial Intelligence Startups, Greater China》,获得中国证券业协会2021年重点课题研究优秀课题,并多次入围字母点评“知识图谱平台领导者象限”。此外,曾参与编写中国电子技术标准化研究院出版的《知识图谱标准化白皮书》、《知识图谱选型与实施指南》、IEEE-P2907课题《信息技术 人工智能 知识图谱技术框架》(国标计划号20192137-T-469)߅

(1) 语意网络已经成为必要元素。
在去年就有人在说:网站是否具备Semantic(语意)标记或是策略,将会开始影响流量。但是今年已经不只会影响流量,而是会严重影响SEO成效。
我们可以看到Google逐步推出各种算法,都是朝着机器学习(Machine Learning)与人工智慧(Artificial Intelligence)的方向,这是搜索引擎最后必然经过的阶段,才有办法理解越来越庞大的网络数据资料。从Schemaorg的结构化语意标记,到知识图谱(Knowledge Graph),然后蜂鸟算法(Google Hummingbird)、RankBrain、以及Tensor Flow,具有语意标记的网站将更可以被这些演算法更理解而获得更多好处。
语义分析现在的搜索引擎不管百度还是Google都进行了很大规模的变化,无论是算法上,还是搜索结果排序甚至是展示形式上,都迈出了一大步。未来就是在复杂海量的数据中满足每一个用户的个性化需求,而不是以前的笼统全部数据处理、建库、排序问题。
(2) 使用者因素越来越会影响SEO成效。
使用者因素是什麽 就是使用者如何搜索,以及使用者如何使用你的网站,而产生的种种数据。也就是如果你的网站被显示在搜索结果,但是都不被点选,网站很可能就会被降级。
如果搜索者点选你的网站,但是马上又返回到搜索结果,表示你的网站不是满意的结果,也很可能会被降级。当使用者浏览你的网站,就会产生各种数据,例如跳出率、停留时间、阅读页数等,这些数据也会开始影响SEO成效。SEO的方向会由纯技术层面转而更著重人的因素,你不应该只去分析搜索引擎的演算法,而应该去分析使用者需求。
这种情况就是我们之前说过的搜索经验最佳化(Search Experience Optimization),这类因为使用者而引起的影响,是Google一直不愿意正面承认的,前几天Google曾经说使用者的点选会影响在地搜索结果,但是后来该文又被更正。但是许多实验证明使用者因素确实是影响SEO成效的重要因素。你的网站要以使用者的满意度当成重要指标,才能够得到更好的搜索曝光度。
Google的站长工具在服务协议里明确的写出你的数据将被广告推送或数据采集使用。百度的站长工具平台的{流量与关键词}功能模块:点击量、展现量、点击率和排名四个维度,而且排名也是展现、点击、点击率重要因素计算出来的结果。也就是说你的用户使用你网站的用户轨迹将是评价你网站品质的重要因素之一。
(3) 语音搜索开始取代文字搜索。
原本大家都是打字进行搜索,但是手机及语音助理出现之后,情况将会逐渐改观。语音搜索将开始变成大家使用行动搜索的方式,并且由于行动搜索量逐渐提升,因此语音搜索将会逐渐取代行动文字搜索,甚至取代所有文字搜索。语音搜索的逐渐普遍,可能传统关键字会有更加长尾化的趋势,这个不知道是否可以再2016年实现。
语音搜索增加会对SEO产生什麽影响呢 就是查询词会变得更口语化,不再只是重要关键字,这个变化也会连带影响关键字分析及网页内容的关键字布局。
意思是不只要只关注文字搜索的关键字布局,还需要关注口语化的关键字布局。
前一段时间参加百度会议的时候,百度移动产品经理明确提出来搜索、语音搜索将被视为更友好的功能,排序将会优先对待。百度的移动排序和PC排序完全是两个体系,但是根本目的都是一样的,只不过PC端那些影响排序因素变成了移动端的字体大小,广告位置,交互功能,多设备。
(4) 关键字研究转变为主题研究。
由于上述的语音搜索以及蜂鸟演算法等的影响,网页的主题(Topic)将会比关键字(Keyword)更重要。所以原本的关键字研究必须演化为主题研究,才有办法让网页产生更强的相关性。主题研究的意思就是,当搜索引擎接到使用者的查询,会开始了解搜索者的意图(Intention),如果你的网页不在这个意图里面,就不会出现在搜索结果。意思是关键字研究已经不符合满足用户个性化需求,必须进行更全面的主题研究,才有办法应付未来的关键字布局。
百度在抓取一个网站时候会先抓取少量页面,进行分析处理,提取特征,建立属于你网站的Pattern聚合,对你网站内容,页面,链接进行聚合处理,综合评价,也就是将你的网站归在某一个大的主题之内,进行排序or展示备选。另外这里要说明一点,网站被抓取初期不要进行频繁修改,也不要赋值copy低质量内容滥竽充数,一旦pattern低级定位,很难走出来。一开始你有一个好的,优质的pattern,以后内容差点也没关系。这点也提醒SEOer别再让让你的空格还是标题字符,好好研究下你的主题。从你的钻牛角眼执行层脱身,视野宽阔的看一下策略层事情。
(5) 网站必须注意网站安全性及传输技术趋势。
>

文/孟永辉


近期,云知声向上交所撤回了科创板上市申请。据了解,公司本次主动撤回IPO申请,主要是出于公司战略发展因素考虑。


但凡对语音行业稍有了解,就一定不会对云知声这家企业感到陌生。 作为一家以AI语音技术起家的独角兽企业,云知声以其“云-端-芯”的战略思维,从语音交互入手,逐渐构筑起了一个包括机器学习平台、AI芯片、语音语言、图像及知识图谱等技术的技术城池。


规模优势显著,先后获多家知名机构青睐


云知声成立于2012年6月,是一家为企业和用户提供智能语音技术和综合解决方案的人工智能企业。那时候,AI创业在行业中尚属稀缺,深度学习也尚未完全成熟,就连举世闻名的Alpha Go大战李世石也发生在四年之后。但是在那时候,云知声就已经一头扎入了AI交互方案的研发,并在2012年底,就完成了包括语音云、深度学习及超算平台的三驾马车构建,率先将深度学习应用到语音识别产业服务中,通过深厚扎实的技术研发奠定了在行业中的广泛影响力。


2012年云知声首家推出语音开放平台、率先将DNN引入语音领域;2015年启动造芯并与2018年5月推出业界首款语音AI芯片,2019年年初发布多模态AI芯片战略,与吉利旗下 科技 公司成立合资公司研发车轨级AI芯片(已完成所有车轨级验证报告) ;在业界率先提出“云-端-芯”产品战略等举措都让云知声在行业内体现出来非同一般的领跑能力。


就拿芯片来说,芯片的重要性,自然就不必细说了吧。而「造芯」,似乎也成为了AI企业的技术标配。云知声自然如此,甚至要比大部分企业察觉的要早。


他们在2015年,阿尔法狗掀起AI浪潮的前一年,就率先宣布搭建了芯片团队,着手开发 uDSP 处理器和 DeepNet IP 技术。


2018 年,云知声就率先交付人工智能语音芯片——「雨燕」。


2019 年,推出了车规级芯片「雪豹」和面向家居领域的第二款升级版芯片「蜂鸟」系列,并启动具备“图像+语音”多模态交互功能的芯片「海豚」的研发。


云知声作为国内为数不多拥有全链条语音交互技术的人工智能企业,八年时间成长为领域领军企业,不仅在技术且在商业化道路方面,也呈领跑趋势。长期以来,公司在研发层面的重金投入,也在伴随市场的不断成熟转换成规模优势。2017年-2019年,云知声营收分别为611407万元、197亿元、219亿元,年均复合增长率高达8914%。


值得一提的是,自成立以来,云知声完成多轮融资。2019年4月1日,云知声完成D轮融资,投资方为中金公司、东方证券及清和泉资本,还曾在2018年7月完成6亿元C+轮融资,中国互联网投资基金领投;C轮共融资1亿美元,投资方为前海梧桐并购基金,创下语音技术领域单轮融资最高记录。2014年公司获得了高通创投及老股东启明创投的B轮融资。


挖掘市场细分需求,技术赋能生活场景


目前,云知声自主研发三类芯片IP(深度学习处理器芯片IP、数字信号处理器芯片IP、图像处理芯片IP),都已经投入使用,并在持续优化中。应用场景涵盖智能家居、智能医疗、车载产品、教育机器人等语音、图像交互场景中。


医院和家居这两种场景的语音交互方案,都是云知声目前已经落地并广泛应用的产品。可见,人工智能已经逐渐渗透并细微如丝地改变着我们的生活。


据统计,约有一半以上的医生每天有超过两个小时的时间都在记录和整理病历,占用医生工作时间的比例非常之高。而在北京协和医院,通过一款软件、一个麦克风,医生只需口述诊断,病历就能自动生成在PC屏幕上。这不仅帮助医生提高了工作效率,更能将病历模板转化为高质量的诊疗数据。


这一技术的出现,大大地促进了医疗人工智能水平的推进。在家居场景下,人们通过远场识别技术,用语音控制空调、照明和音箱等各种智能设备,完全解放了双手。


云知声从2016年切入医疗领域至今,积累了深厚的医疗专业技术。借助于合作医院以及自由专业医生团队以及原有的自然语言处理技术,云知声构建了大规模全科室的医疗知识图谱。在此过程中和中科院自动化所合作的论文获得CCKS (知识图谱与语义计算大会 2019) 最佳论文,《大规模知识图谱构建及其应用》获得2019年北京市 科技 进步一等奖。云知声的医疗知识图谱以及相关应用平台也被多家三甲医院采购。




可以看出,云知声东南总部作为福建省唯一具备语音识别、超算能力、深度学习算法、大数据、芯片能力等人工智能底层技术全链条的企业,正发挥自身已经积累多年的技术实力和资源优势,时刻寻找着机会,在疫情时期乃至后疫情时代,企业纷纷进行 科技 转型的浪潮中,脱颖而出,成为企业升级的“助推器”。


同时,可以预见的是,一旦云知声智慧物联在酒店、地产等领域起势,或将贡献不菲的收入,进一步拓宽其营收来源。由此可见,云知声发力造芯,并力推商业化落地这步棋走对了。因此,你会看到,自2018年推出自研芯片“雨燕”后,其营收结构大为改善,不仅实现较快增长,并保持逐年增长的态势。


今年上半年,得益于规模化推广“蜂鸟”,并放弃毛利率较低的产品,云知声智能语音交互产品直接硬件采购成本占比降至2617%,毛利率显著回升。种种迹象表明,经过多年实践,云知声“云-端-芯”这一战略已完善成为一套成熟的逻辑闭环,具备面向市场需求的快速产品化能力。考虑到AI产业经过大浪淘沙后玩概念、讲故事那套已行不通,像云知声这种玩转商用化落地的玩家才吃香。


研发持续高投入,核心技能自主可控


在生活场景逐渐被AI渗透的时代,技术是一个公司的安身立命之本。 云知声是最注重技能立异的AI企业之一,由于其深知核心技能自主可控是一家AI企业的安身立命之本。 在我看来,云知声之所以构筑技能优势,既与开创团队对技能的注重有关,也与在研制上坚持高额投入密不可分。


一方面,云知声四位联合开创人均具有清一色的技能背景,董事长兼CTO梁家恩与副总裁康恒均结业于中科院自动化所,CEO黄伟与副总裁李霄寒均在摩托罗拉等企业积累丰厚的实战经验。开创团队对技能注重,为公司发展定下技能立业的主基调,不遗余力地招募技能人才。数据显示,云知声团队规模已超500人,其间研制团队多达344人,占比超68%。


在算法方面,公司在机器学习前沿技术和专项应用技术方面始终保持高效的演进速度:公司于2012年率先将深度神经网络(DNN)应用于商业语音识别系统,并在后续的人工智能浪潮中持续进行前沿算法的商业实践,例如,后来涌现的卷积神经网络(CNN)、回归神经网络(RNN)、端到端序列建模、生成对抗网络(GAN)、注意力转换模型(Transformer)、双向编码表征转换模型(BERT)、知识蒸馏(KD)、自监督学习(SSL)等主流技术方法,公司都是业界最早的产业实践者之一。


另一方面,一直以来,云知声在技能投入上高举高打,直观的数据最能说明问题。招股书显示,2017年至本年上半年,公司研制投入分别为099亿元、152亿元、258亿元和9242万元,占营收比重分别为1635%、776%、1177%和1091%,累计研制投入占累计营收比重为1074%。换言之,云知声营收简直全部投入到研制中。


不难看出,云知声是一家有技能崇奉的AI企业,为继续构建核心技能和产品系统、坚持竞争力,大手笔砸向研制。


归根结底,一家AI企业成长的意义不仅仅是能获取多少高额利润,而是它的技术和产品能给人们生活带来多少品质的提升、给产业带来多少降本增效的价值、给 社会 带来多少效益。


“如果声音有形状,那一定是爱(AI)的样子”,正如云知声对企业的赋能作用始终与 科技 同行,云知声汇集了一群有梦想和共同愿景的人,相信 科技 改变世界,相信人工智能会让未来生活更美好。


—完—


孟永辉,资深撰稿人,专栏作家,特约评论员,行业研究专家,战略咨询顾问。长期专注行业研究,累计发表 财经 科技 文章超400万字。支持保留作者来源的分享,转载请保留作者版权信息,违者必究。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://www.outofmemory.cn/yw/13339400.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-17
下一篇 2023-07-17

发表评论

登录后才能评论

评论列表(0条)

保存