笔趣阁 - 玄幻小说 - 神话科技工厂在线阅读 - 第四十六章 一个新市场

第四十六章 一个新市场

    在过去的几个小时里,唐毅其实并没有仔细看过这款输入法的介绍。

    在他看来,现在的输入法市场,是个彻底免费同时完全被垄断的行业,没有任何发展前景。

    但现在,他发现自己错了,错的很离谱。

    初级科技-输入法-未命名:

    人类迈入信息集成时代的基础输入法,具备异常庞大的逻辑库,成型文字具有不可选取性,是一款高度私密的输入法。

    建议售价:自定。

    所谓信息集成时代,又叫做信息大一统,简单来说,就是所有信息都运行在一个载体上。

    好比我们所处的太阳系,九大行星就是信息数据,太阳这个引力中心构成的封闭系统就是载体。

    在载体上,所有的信息都具有唯一性——我们可以在太阳系里找到木星,找到火星,却无法找到第二个物理属性一样的地球。

    这种唯一性,在信息层面叫做不可复制性,也就是输入法介绍中的....不可选取性。

    这些理论唐毅其实很清楚,但是他压根没转过弯——直到被深蓝提醒,他才“啵”的一下开窍了。

    这款输入法,有个与它无比契合的市场:网络文学。

    随着各种信息终端的普及,网络小说已经逐渐覆盖了我们生活中的每个角落,几乎在任何地方,大家都可以看到拿着手机看小说的人。

    唐毅就不止一次在地铁上,见到七八十岁的老爷爷拿着一台老人机在看小说——还特么是玄幻的!

    不过鲜少有人对整个网络文学有具体的认知。

    在2017年,阅文集团在香江上市,上市首日股价暴涨一倍,目前集团市值600多个亿。

    根据阅文在去年年终公布的财报来看,去年一整年阅文旗下的起点、创世、云起书院等网站,共计发放了超过一百亿的稿费。

    这还不包括各类动漫和影视版权的费用。

    在整个网文行业,去年所有网站旗下的作者数量超过了640万,发放的稿费超过五百个亿。

    而且,说到网文,就不得不提到两个字:盗版。

    盗版出现与发展的原因我们暂且不谈,只说一项数据:网文界所有盗版网站日流量的综合,是正版网站日流量的50倍!

    这是一个既合理、又吓人的数字。

    盗版网站的操作手法其实很简单:截屏或者对整个屏幕进行文字提取,将摄取后的文字整合成章节,最后上传到自己网站。

    从头到尾不需要任何人工程序,一些盗版网站连同站长在内才一两个人。

    唐毅自己也爱看小说,不过由于工作原因,他每天大都只在地铁上简单扫扫。

    连同月票红包在内,一个月阅读开销也就三四十块钱。

    他曾经和一些普通网络作家聊过天,这类作家对盗版的态度都很一致:深恶痛绝。

    这其实很正常,盗版读者暂且另说,那些盗版网站的所作所为完全就是在抢他们的钱,这个矛盾点是没有任何化解的可能性的。

    至于那些盗版读者,其实和什么正版意识无关,纯粹就是不想花钱罢了。

    当初搜犬小说开始收费后,那些盗版读者还不是有大部分选择了付费阅读?

    这种是人的逐利本性在作怪,亿万富翁都还有在街边和菜贩子讨价还价的呢,太正常不过了。

    毕竟不想花和花不起纯粹是两码事儿。

    理论层次的东西唐毅不准备去深究,他在意的是:这样一款输入法,对于网文作家来说,能有多大帮助?

    文字提取的核心技术是OCR,也就是光学字符识别,OCR技术的核心关键在于逻辑库里的核心算法。

    这个算法覆盖了一定量的词段,所以在扫到这种词段后,它会自动识别并且区分。

    而科技工厂的这款输入法,它自带的逻辑能力庞大到了足以碾OCR的核心数据库,从而让打出的文字具有了不可选取性。

    好比一只蚂蚁,平时它搬运的是米粒、叶子这些小物件,忽然有一天让它去搬一辆摩托车,纵使是蚁群中最强大的工蚁对此也束手无策。

    这是体量上的碾压,干净利落。

    为了验证这一想法,唐毅取出手机,打开了企鹅。

    现在企鹅客户端有许多小功能,大家熟悉的有红包、贴图这些,其实企鹅还有一项不太被大家熟知的功能——文字提取。

    这项功能的操作方式很简单,长按一张图片,在“发送给好友”下方,就有着“提取图中文字”这一选项了。

    实际上,有一些超小型的盗版网站,盗取小说用的就是这项功能。

    唐毅打开起点中文网,随意找了一本小说订阅付费章节,截图,提取。

    几秒钟后,这段章节截图中的文字全部被提取了出来,没有一个错误。

    接着唐毅又呼出科技工厂光幕,将那款未命名的输入法导出到了深蓝上。

    深蓝:“?(???)?感觉有什么东西进来了呢....”

    唐毅:“???”

    很快,输入法安装成功,唐毅创建了一个TXT文档,想了想,输入了一首林则徐的古诗。

    “休信儿童轻薄语,嗤他赵老送灯台。

    力微任重久神疲,再竭衰庸定不支。

    *******,*******。”

    接着他把这三行诗保存,又用手机对屏幕拍了照,点下拆行提取。

    出来的结果是这样的:廾呟t貌肜闽E亐u脌u亐婱勩鰛M。

    一段乱码!

    随后唐毅又试了两次,文字提取后出现的都是乱码!

    要知道,企鹅的OCR词库,在业内甚至是要超过千度和谷歌这两款搜索引擎的。

    因为企鹅做的是即时通讯软件,每时每刻进行的信息传递与交汇不计其数,单说汉语词库方面,企鹅在全球当属第一!

    而现在,企鹅的OCR词库,居然拿这款输入法束手无策。

    这代表着无论是直接提取,还是oracle拆行都无法做到识别文字!

    那么,如果这款输入法覆盖到网文领域,对于盗版网站来说,那将会是个毁灭性的打击!

    也许有人会说,文字提取不能做,那么雇人打字搬运呗?

    这个方式理论上是可行的,毕竟这款输入法的逻辑库还无法影响到现实。

    但是.....

    单说一家阅文平台,每天在更的小说就不下十万本,其中读者数量可观的至少也有两三万。

    整个网文行业数字至少要翻三倍。

    好几万本的小说,要雇多少人打字搬运?

    我们按一本书每天更新6000字这个基数来算一算。

    普通打字员每分钟分钟的打字速度大约在100-140之间,一小时大约就是6-7千字。

    也就是说,这位打字员一小时能搬运一本书的当天更新量。

    不考虑疲劳度的情况下,一位打字员每天大约能搬运8本左右。

    那么....要搬运整个网文行业的在更新书籍,需要招聘近万人打字!

    整个盗版行业,哪怕是招聘线上打字员单结,又有几家网站能负担的起这样的支出?

    这样一来,网文作家的收入可以增加多少?

    如果对使用这款输入法的作家逐一收费.....

    要知道,网文行业的作家数量,足足有六百四十万!!