2015年10月和11月,搜狗基于其所拥有的输入法领域专利向北京知识产权法院、上海知识产权法院和上海高级人民法院,发起了专利侵权之诉,指控百度旗下的“百度输入法”产品侵犯了其17项专利权,诉讼总标的额高达2.6亿元。由于该系列案件引起行业和公众的广泛关注,被媒体冠之以“中国互联网专利第一案”。

2018年4月4日北京知识产权法院对6件搜狗诉百度系列专利侵权案件作出一审判决。这意味着,搜狗与百度专利大战初局已定:专利无效程序中,搜狗17个涉诉专利中7专利被全部无效,4专利被判部分无效;在民事侵权诉讼程序中,搜狗被迫撤诉10件,一审法院判定4案件不侵权。

两个互联网公司为何会在输入法领域大动干戈,这背后又有哪些商业和市场考量?本文试从输入法技术入手,解析案件。

所谓“输入法”,通常是指输入法软件。诸如中文、日文、韩文等非拼音文字一般需使用输入法进行录入,输入法将用户敲击键盘输入的键盘消息编码匹配为字词库中对应的文字并输入上屏。早期的输入法技术集中在PC端输入法的基础功能部分,比如编码、全拼、双拼、智能组词等。当迈入互联网时代,PC端输入法与网络技术结合,很大程度上提升了词库的丰富度和用户的输入体验。而与此同时,手机端输入法也随着移动设备的发展,从封闭式平台、只能依赖于手机厂商整体烧录软件的功能机时代演进到半开放化平台、用户下载安装软件较为繁琐的初代智能机时代。

当移动互联时代来临,智能终端设备具有更加强大的处理能力,Android和iOS操作系统提供了开放性的平台,这促使第三方输入法软件蓬勃发展。由于PC端输入法市场逐渐趋于饱和,互联网巨头纷纷将目光集中到由智能终端设备构建的移动互联网,而此时的输入法已经从单纯的输入工具上升到具有战略意义的互联网产品。搜狗利用PC端输入法产品积累的技术和用户优势迅速占领手机端输入法的市场,成为领头羊。而百度公司的手机端输入法一经推出即以优异的性能、丰富亲民的功能配置获得广大用户的喜爱,成为百度布局移动互联网的重要产品。搜狗和百度这对竞争对手的专利大战正是在这样的背景下拉开序幕。

搜狗提起诉讼17件专利实际上覆盖了搜狗在互联网PC输入法时代引以为豪的核心技术。例如,旨在提升词库丰富度和准确度的细胞词库、互联网词频库、网络获取新词;旨在智能组词的系统多元库和用户多元库;旨在提供丰富的输入样式的艺术字、图片和表情的输入方法;以及旨在提高输入效率的智能定义删除字符串、中英文混输、恢复候选词顺序以及候选项的优化显示等等。可以看到,这17件专利技术分布颇为立体,几乎涵盖了互联网PC输入法的方方面面(参见下表)。

编号 专利号 涉及的输入法技术 案件状态
1 200710099474.6 细胞词库 专利被全部无效,原告撤回起诉
2 200610127154.2 艺术字输入 专利被部分无效,原告撤回起诉
3 200910092405.1 图片输入 专利被全部无效,原告撤回起诉
4 200710179718.1 表情输入 专利被部分无效,原告撤回起诉
5 200610170641.7 取消字符串 专利被全部无效,原告撤回起诉
6 200710073274.3 显示全部候选项 专利被全部无效,原告撤回起诉
7 200710079267.4 系统多元库 专利被全部无效,原告撤回起诉
8 200810116059.1 通信录输入 专利被全部无效,原告撤回起诉
9 200910236605.X 匹配准确率 专利被全部无效,原告撤回起诉
10 200610086577.4 互联网词频库 专利被部分无效,原告撤回起诉
11 200810113984.9 用户多元库 一审认定不侵权
12 201010102273.9 中英文混合输入 一审判定百度停止侵权
13 200610061369.9 词库同步 一审认定不侵权
14 200610063620.5 恢复候选词顺序 一审认定不侵权
15 200810116190.8 重新定义删除键 一审判定百度停止侵权
16 200710176654.X 网址输入 一审认定不侵权
17 200610109732.X 获取新词 权5百度构成侵权,其他权利要求不构成侵权

搜狗意图非常明显,就是要利用自己在输入法领域的技术积累,排除对手百度的商业竞争,特别是要在当下火热的手机端输入法领域打压百度。试想,如若百度输入法由于侵权成立而被迫卸载智能词库、停用图片和表情输入、取消便捷高效的智能个性化输入方式,如何还能在手机端输入法领域与搜狗抗衡?其市场份额必然拱手相让,而且更为重要的是百度将会失去手机输入法这个能够跨应用而与用户紧密对接的上游互联网产品。

搜狗此役投入巨大备战充分,但一审程序终了却并未能如愿压制对手。问题究竟出在何处?作为被告百度的代理律师,根据我们的观察和思考尝试以此案为背景探讨一些共性问题。

问题一:搜狗诉讼专利筛选未充分评估专利稳定性以及现有技术对专利保护范围的影响

专利诉讼程序中,由于诉辩对抗,被告必然会拿起专利无效程序这个武器,对专利的稳定性发起挑战。同时在诉讼中,被告还可能选择借助于检索到的现有技术来界定权利要求保护范围或直接进行现有技术抗辩。因此,专利权人在发起专利诉讼之前,一方面需要谨慎监视专利所存在的各种瑕疵,充分评估专利稳定性,另一方面在进行侵权比对时还需将现有技术对保护范围的影响纳入考量。

第ZL200710099474.6号专利涉及搜狗著名的细胞词库技术,然而该专利被全部无效。专利提出,将一个完备的输入法词库进行分类,按照不同用户的输入习惯来组织词库的子集,即所谓“细胞词库”,输入法客户端可以根据用户需要选择加载相���的“细胞词集”,而且还可以利用自动更新模块对客户端的“细胞词集”进行更新。由于仅需加载用户所需的“细胞词集”,可减少计算机资源的分配,亦可提高用户的输入效率。然而,从上述介绍可以看出,虽然专利定义了“细胞词库”、“细胞词集”这样新颖、炫酷的术语,但是究其技术实质而言,仍然是描述一种分类词库的方案。早在申请日之前,输入法技术较为发达的日本就有多篇日文文献公开了类似地“分类词库”的技术方案。例如,特开2002-342319号日本专利文献中,就明确提出,可以建立分类词库,例如“信息、电子、化学、机械、航空、政治和经济、公司名称、地点名称”等可供用户选择下载的词典,起作用或效果也于专利所述完全相同。正如,专利复审委员在第30260号无效决定中所认定的,“本领域技术人员无需花费创造性劳动就可以得到本专利(搜狗涉案专利)权利要求1的技术方案”。因此,即便搜狗在中文输入法中第一个运用所谓“细胞词库”(即分类词库)技术,并且客观促进了中文输入法向当时的世界前沿输入法技术看齐,但是由于并非搜狗原创并不能获得专利权的保护。

实际上,如果搜狗在申请专利时能够相对客观的评估现有技术,在已有分类词库的基础上挖掘针对中文词库的改进方案,而不是通过创造新名词、新概念来获取最大保护范围,相信搜狗有关“细胞词库”技术的专利会更有价值,或许能够成为专利诉讼的“杀手锏”。在诉讼策略层面,当专利保护范围过大,稳定性难以维系,这样的专利并不适合作为专利诉讼的权利基础。一旦进入诉讼,专利必将被至于各方的显微镜之下,一词一句都会被细致剖析。虽然有些专利在申请时尚能通过专利代理人妙笔生花涉险授权,但是诉讼和专利无效程序双方存在激烈对抗,“花拳绣腿”难以抵挡“真刀真枪”的攻击。筛选诉讼专利需以客观之心评估,不存侥幸心理,即使条件所限缺陷在所难免,也要充分评估风险并制定应对策略,诉前便达到“沟壑了然于心”。作为原告一方,享有进入诉讼的主动权,应投入足够的时间和精力进行诉前准备,过于自信盲目发起诉讼并不可取。

这里还想探讨一下备受关注的“亿元赔偿案”——第ZL200610127154.2号专利“一种向应用程序输入艺术字/图形的方法及系统”。

艺术字/图形、图片以及表情输入是搜狗输入法互联网PC时代的特色功能之一。为了满足网民在BBS论坛、聊天室、以及初代即时聊天工具上对丰富输入样式的需求,搜狗输入法提供了实用的图形化对象输入功能。在涉诉的17件专利中,有三件专利ZL200610127154.2艺术字/图形输入、ZL200910092405.1图片输入(腾讯专利)、ZL200710179718.1表情输入,均涉及这一技术,虽然申请时间相隔几年之久,但三专利保护范围相互重叠,因为显然“图形”和“图片”在本领域没有任何区别,而“表情”通常亦包括图片形式。而无论最终上屏样式是艺术字、图片还是表情,其输入技术的核心即建立输入编码和上屏样式之间的映射关系。最终三项专利中,图片输入专利被全部无效;艺术字/图形、表情案被部分无效,直接导致原告搜狗撤销民事侵权诉讼请求。

在对“亿元赔偿案”的艺术字/图形案件进行现有技术检索的过程中,我们发现早在初代输入法中就已经能够处理艺术字形式,比如单行字符串、字符阵等。特别是,当时技术领先的日文输入法已经能够基于预先建立的映射关系输入图片——这种完全不同于文字的上屏样式(参见日本专利申请公开特开平2000-148748)。通过大量现有技术举证,最终专利复审委员会认为,“专利涉及多种艺术字样式均基于相同的技术原理实现,其不同之处在于建立映射关系时各种艺术字样式所存储的内容不同从而输出的视觉效果不同。在证据4(注:即上述日本专利申请公开特开平2000-148748)公开了图像文件(图形)的情况下,为丰富输出的内容,本领域技术人员很容易扩展到采用相同技术实现的其他公知的艺术字样式”,由此认定艺术字/图形专利的大多数权利要求均不具备创造性,应该被无效。

在后续民事案件审理中,原告搜狗为了使得民事案件得以继续,基于艺术字/图形专利中被维持有效的权利要求追加诉讼请求。然而,此时涉诉的技术方案已改变为一种对艺术字样式再扩展的方案,要求预设一种ASCII码字符或者ASCII码图形替换规则,然后根据用户输入,在已匹配的艺术字样式上做出字符/图形替换而生成新的艺术字样式,供用户使用(参见从属权利要求7和8)。经细致排查,百度输入法完全没有实现如此方案。原告注意到百度PC输入法能够通过用户自定义界面,自定义输入编码、候选项显示内容和实际上屏内容之间的映射关系,由此认为当用户进行自定义ASCII符号时即实现了专利的艺术字样式再扩展。虽然搜狗的指控已经脱离技术事实,但是由于权利要求要求语言的模糊性,经过一轮交锋百度并不占明显优势。

再一次地,我们通过现有技术找到证明百度不侵权的明确依据。通过地毯式检索,我们发现申请日之前发布的极点五笔5.1版输入法已经支持了与百度自定义功能类似的功能,用户可以通过手动填写设置文件,来配置输入编码、显示候选项以及上屏字符,三者之间的映射关系。虽然极点五笔5.1提供的自定义界面相当粗略,但是其工作机制已经充分表明,搜狗所指控的自定义功能是申请日之前的现有技术,无论如何对权利要求进行解释都不应被包含在专利的保护范围之内。经过当庭的演示和双方辩论,事实和法律的天平最终倒向百度,亿元天价赔偿案以搜狗撤诉而告终。

从“亿元赔偿案”的整个办案过程看,对现有技术的检索贯穿始终。一方面,为了进行专利无效,需要了解现有技术状态,大量搜集现有技术证据;另一方面,在侵权诉讼过程中,针对不同的被控技术方案仍需要进行大量的现有技术检索。专利诉讼中被告所面临的一个困境在于,一旦专利权维持有效,由于双轨制的设定,专利权人不可避免地要对其权利要求做扩大解释,有时会突破合理的边界。尽管被告可以引用专利说明书以及专利权人确权程序的意见陈述,但是由于语言本身的模糊性和可解释性,有时仍然难以说服法庭。此时,如果能够引入现有技术证据,协助界定和说明专利权应有的保护范围,或者像在艺术字/图形案件中一样直接进行现有技术抗辩,则能够帮助被告最大程度上走出困境,证明自己的“清白”。现有技术永远是检验专利权人能否获得专利权保护的一项利器。从司法审判角度看,把握好现有技术证据的使用,能够平衡专利权和公众利益之间的关系,防止专利权的滥用,从本质上促进新技术的发展。

问题二:对于涉及计算机软件的专利,实现与专利类似甚至相同的技术效果或者达到类似的用户体验,并不意味着一定采用相同的技术方案

输入法是一种软件产品,而涉及输入法的专利通常属于涉及计算机软件的发明。根据专利审查指南第二部分第九章的规定,涉及计算机软件的发明可以通过方法流程以及对应的软件功能模块来获得保护。搜狗17件涉诉专利均按照审查指南的要求进行布局,即要求保护软件执行的方法,又要求保护具有对应功能模块的装置。但是基于计算机软件专利指控侵权时,由于专利权人难以获取疑似侵权软件的源代码以及内部数据结构,因此只能根据外在功能或者效果反推疑似侵权软件的内部技术方案。可以想见,类似甚至相同的功能,其具体实现方法多种多样,并不唯一。即使被控侵权输入法软件也具有专利旨在实现的类似技术效果,也未必使用了专利技术方案。

北京知识产权法院所审理的“恢复候选词顺序案例”案中,搜狗认为百度手机输入法从表面现象上能够实现专利描述的技术效果,将用户输入的拼音词条的候选词排序恢复到原始默认顺序,因此侵权其专利权。然而,一审法院经过审理已经判定百度输入法并未实施专利技术方案,因而不侵权。

涉案专利为了实现恢复候选词顺序的技术效果,采用了独特的技术方案——在词表中为每个拼音词条节点设置标志位域,通过其中标志位的不同取值,来指示输入法此时应该对某个拼音词条以自学习顺序还是原始顺序来显示候选词列表。显然,作为专利侵权判定,仅仅实现了相同的效果是不够的,只有被控侵权产品也使用了具有这样标志位域的词表,并且执行相应的判定步骤才会落入专利的保护范围。

而百度恰恰是通过完全不同的手段实现了与专利类似、甚至更好的效果。百度手机输入法并不依赖特殊的词表结构来实现候选词顺序的调整,而是通过精准的排序算法根据用户词频和系统词频对候选词排序进行计算,从而根据用户对候选词的选择动态调整拼音词条的候选词顺序,将最符合用户习惯的词语提示在候选词列表的前列。当恢复顺序时,百度输入法只需删除特定候选词,例如拼音词条“da’jia”的候选词“大驾”的用户自学习词频即可。此时候选词“大驾”而言,由于只有系统默认的词频信息参与计算,它的排序已经不提现用户之前输入习惯。百度的方案看似也能够对候选词顺序做调整,但是却比搜狗的技术方案更加灵活,而且也不需要以来特定的词表数据结构来支持,因此更容易进行扩展或与其他功能融合。在此案的庭审过程中,我们通过设计大量反证实验以及对词库数据的保密开示,证明百度并未实施专利技术方案。通过大量证据充分说明了即使被控输入法产品具有专利描述的相似功能,其后台采用的技术手段亦可能完全不同。

通过以上案件分析可以看到,当专利技术方法涉及软件的后台操作时,需要仔细推敲被控产品的外在功能与内部实现的对应性。毕竟专利所保护的是由技术手段所构成的技术方案本身,而不是所达到的技术效果。从专利保护和技术发展的关系上看,对于同一类软件功能,应该鼓励以多样化的技术方式加以实现,通过市场优胜劣汰。而不能通过专利画地为牢,只要与专利描述的用户体验类似就认为侵犯了专利权,人为的排除良性技术竞争。这样只会限制技术的发展,让专利成为后入市场的竞争者的桎梏,并不符合专利制度的设计初衷。

问题三:搜狗在互联网PC时代积累的专利实力并不必然作用于移动互联时代智能手机端输入法

搜狗早在2006年6月推出基于初代PC的搜狗拼音输入法1.0。此后几年间,搜狗PC端输入法产品不断演化,以满足PC互联网时代用户的需求。一些公开数据可以看到,在这一时期搜狗做了大量技术积累,同时获得大量授权专利。涉案的17项专利中,大部分专利的申请日处于2006-2008这一时期。而且从专利说明书的描述可以清楚地看出,这些专利以PC输入法为背景,所要解决的技术问题以及所提出的技术方案也是基于当时PC输入法的系统环境(多为Windows操作系统)所描述的。有的专利中对手机中的应用略有提及,但是并没有描述具体方案。而且由于在此时期Android和iOS系统尚未发布,且基于触屏的人机交互模式也尚未成熟,因此17件专利几乎不涉及对于智能手机的功能扩展。

随着智能终端时代的来临,用户网络行为已转向手机端。搜狗和百度均在2009年推出了Android版手机输入法,之后又陆续推出iOS版手机输入法。此时的智能手机无论在硬件还是软件操作系统方面都与PC机、功能手机,乃至初代智能手机有了质的飞跃。对于与输入硬件和操作系统密切联系的输入法产品而言,Android和iOS时代的输入法产品在工作方式和机理上都与PC时代基于windows操作系统的输入法存在极大不同。在这样的技术背景下,搜狗以PC机为应用环境的很多专利方案并不适用于智能手机,或者即使存在类似的技术效果其实现原理也完全不同。这实际上也是搜狗屡屡在侵权比阶段失利的深层次原因。

专利申请具有前瞻性。一旦获得授权,在专利保护期内,专利权人可以排除他人实施落入专利保护范围的一切在后技术。比如高通某些基础通信领域专利,在二代、三代、四代通信系统中都是标准必要专利,甚至有可能覆盖第五代通信系统的功能。然而,对于依赖于特定技术环境的实用技术型专利而言,如果技术环境已经发生大的变革,则很有可能不再能适用变革后的技术。由于搜狗与百度相争主要目标是手机端输入法产品,更为理想的是使用智能手机输入法专利精准出击。然而,诉讼中搜狗用来打击目标的专利武器却是PC时代的“老枪”,显然威慑力不足。

结束语:

“互联网专利第一案”一审已全部审结,从该系列案中反映出百度、搜狗两个互联网大鳄尊重知识产权的态度。在得知被诉专利侵权后,百度公司积极应诉,迅速对产品和自有知识产权进行排查和分析,既给予对手的知识产权以充分的尊重,又绝不让自主研发的技术受到他人知识产权不合理压制。互联网企业经过十余年的技术积累,这是第一次通过大规模专利诉讼的方式PK技术实力、知识产权实力。个案胜负之间,似可品出企业的视野和格局。我们最希望看到是,双方利用知识产权助力商业角逐,在知识产权制度的保障下展开充分、良性的竞争,推动输入法乃至互联网行业的发展。