手机浏览器扫描二维码访问
只是交流五次就回答出这个问题,周岩还是比较意外的。
于是他改变了思路,选择提出一个大项目,让01首先提供完成这个大项目需要的步骤。
而很快,01就给出了步骤,一共五点。
周岩给出的要求是:对网络文本进行文本统计分析。
01的回复是:1、导入文本。2、文本预处理。3、文本统计。4、得出结论。
比较简单,周岩给出具体一点的要求。
于是01的回复变成了:1、导入小说文本。2、对小说文本进行预处理,导入停用词表,使用分词工具对文本进行预处理。3、对处理后的分词文本,进行词频统计。4、对词频统计后的结果进行词频统计分析,得出结论。
具体了一些,只不过依旧有点儿宽泛。
不过周岩等不及了,
他直接提出让01根据自己的步骤,生成相关的代码。
而很快,01就生成了一系列的代码。
周岩下载了《斗破苍穹》的小说文本,对这段代码进行验证,很快就得到了不错的数据,虽然不全面,但显然这个项目是能进行下去的。
周岩又对这段代码提出改进要求,包括词频可视化,把词频用云图展现出来,包括对词频进行文本训练,从而找出词与词之间的关联。
这一回周岩提出的要求是对两本文本进行处理,两本分别是金庸老爷子的《神雕侠侣》和《射雕英雄传》。
很快01给出了相应的代码修改,周岩复制粘贴之后,进行测试。
其实需求也特别简单,就是找主角之间的人物关系。
杨过对应小龙女,那么郭靖对应什么,结果:黄蓉。
周岩又找了杨过和郭靖分别对应的关联词,同时让01局限在人物身上,自己设计一个人物词判定代码。
这一回01终于出现了一点错误,比如人物切分上面,会把4个词的人物变成2个词输出。
这就是细节上的毛病了,周岩现在也不是算法小白,知道怎么改进,不过周岩更期待01给出的结果。
于是他把这个问题粘贴给了01,而01也给出了对词频进行判定,如果两个拆分的词同时出现多次,那么判定两个拆分的词合并成为同一个词,并在字典中删除前面两个拆分词,并对已经分词好的数据进行处理,合并两个拆分词,没有分词好的就以该拆分词作为分词依据,照着分词就行。
粘贴进去以后,周岩发现效果意外的不错。
只是之后人物判别上也出现了一些问题,会把武器什么的加进去。
周岩又去问01,01回答了一些代码修改,但加进去以后,依旧是老样子,没法做到细致的划分。
周岩问01有没有什么好的办法,01说在处理之前,就把处理的小说人物给预设出来,这样就不会出现之后判定错误的情况。
也就是从源头解决问题,同样也算是一件很机械的处理方式。
但是人类有时候的处理,同样很机械,而且也是填鸭式的,就比如基因测序。
所以对于这一点也没办法太过要求什么,01做到这个程度,其实已经挺不错了。
周岩又预设了几个小型项目,并对01进行测试。
终于周岩也得出了一个结论。
那就是01已经具备了较复杂的代码作业能力。
我在斗破模拟成帝 我,宇智波义勇,没有被讨厌! 傲世丹神 宗门团宠:五岁小师妹靠修仙称霸啦! 行云声 修道种田平天下 盖世皇太子 神秘让我强大 天界往事 修真界第一冤种 疯了!顶流死对头来我婚礼抢亲了 离婚后继承了亿万家产 一品神卜 邪王嗜宠鬼医狂妃 我的选项成真了! 虐文女主手持疯笔 年代:从魔都译制片厂开始 柯学的不正经学者 快穿:虐文女主好像有那个大病 谈恋爱就是犯天条
新作品出炉,欢迎大家前往番茄小说阅读我的作品,希望大家能够喜欢,你们的关注是我写作的动力,我会努力讲好每个故事!...
都市金手指无敌阎王叫你三更死,谁能留人到五更!你当我叶飞扬是摆设?望闻问切断生死,神针古方定乾坤。无常见了也回头,生死簿上了凡尘。...
作为满级炼丹师,丹药当饭吃不过分吧?为了防身,武道无敌很合理好吧!年度爆款无系统,天才流,无敌文,群像文...
当自身修炼带来的任何副作用,都由自己的敌人承担,那是一种什么体验?于是乎,刘顺义开始疯狂的修炼禁术,修炼氪命的绝招。甚至开始疯狂的修炼透支根基的功法。一是求快速提升实力,二是这些东西很强,三是,反正一切的代价和负面效果,都是敌人承担。不仅如此,还能借敌人的修炼天赋修炼。什么,你说你要与我为敌?还是百年难得一遇的天才?那我可就兴奋了!等等我的敌人,我还没有修炼成这个烧血的技能,你不能死!...
(不好看吃屎)曾经被俱乐部抢购的顶级机娘,如今却被丢在回炉场里无人问津。就算倒贴也没有车手愿意契约,只能绝望地等待回炉。只因她直线加速无敌,却很难转向,被誉为‘杀人赛车’。苏年来自地球的顶级赛车手赛道皇帝。本想在这个赛车技术落后,全靠机娘性能支撑的世界大放异彩,却被俱乐部分配的机娘背叛。带着不屑和怒火,...
十岁的春妮被迫卖到井家大院做童养媳。在这里,她亲眼目睹了井家女人悲惨的经历她在井家的变故中被土匪抓走,被龙家的五少爷救下山,从此和龙五一起走上抗日的道路两个人也牵扯出一辈子的羁绊。...