爱如生国学
登录 | 注册
查看: 3540|回复: 10

VIVO是搜神的第一个使用者?说点想法

[复制链接]
发表于 2007-5-28 14:04:34 | 显示全部楼层 |阅读模式
VIVO是搜神的第一个使用者?说点想法  
VIVO在自己的博客写了如下一篇日志:

推荐一个搜索 引擎 ——搜神

http://www.soshen.cn

当前在读一些古籍,可惜网上电子文本的讹脱窜衍令人无法忍受,于是禁不住去“中国基本古籍库”看了看,发现网站已经改版,其他无足观,新鲜推出的搜神却有点意思。试验了一下,数据质量相当高,V无聊了些,就用它把网上《鲍参军集》里无法输入的难字一一补上,当然,有的时候它也力有不逮,就要去参考中华书局的书面出版物。不是很清楚 数据库 的容量如何,是否有12000种古籍?唯一令人担心的是它可以完全开放到什么时候,会不会像“国学宝典”一样过段时间要收费使用?

中华人民共和国应该花10亿把“爱如生”买下,再花10亿标点校对全部数据,然后放在网上供全世界免费使用,这远比花27亿造一个国家大剧院有价值。

http://vivox.blog.sohu.com/40153846.html

结果很快就看到了回复:

今天刚刚上线,您是第一位访客,谢谢肯定。刚上线还有一些不足之处,我们会继续完善的。
古籍搜索:www.soshen.cn 免费
古籍阅读:www.cn-classics.com 这个是收费的,也有部分免费的 图书 。
公司网站:www.er07.com 希望大家来公司网站论坛多多提意见,我们会做的更好。

跟帖者没有留下名字,但估计应该是爱如生的内部人员吧。V很荣幸成为搜神的第一个使用者,给留言者写了点回复,觉得也许有点价值,就顺便贴在这里吧,供大家参考:

VIVO真的是第一位使用者?好奇您怎么找到这篇日志,是通过搜索的使用记录还是V在典籍网注册的ID?爱如生发展的基础非常扎实,远远超过国学网和迪志的四库全书,如果可以在数据的深度发掘上深下功夫,不但关注机构用户,也注重个人用户,则前途不可限量。

中国古籍的数量大概就12万种吧,而爱如生已经数字化5万,在这5万的基础上,可以有无数种组合变化,比如易学 书籍 1000种、500种、100种、20种。古典诗词10万首,5万首,1万首选集,也可以做3000首的选集,添加简单注解充实一下。思想类著作1000种,500种,100种,50种,数量不同,价格则变化。其实也需要类似于国学公司国学备要,国学备览的东西,例如国学基本典籍50种、100种、300种、500种。在海量电子文献的基础上,怎么组合都不是问题,关键在于要有有创意可以吸引消费者的想法、卖点,数量足够,价格便宜。

V看了一下爱如生推出的 产品 组合,其主要弊端在于没怎么考虑个人使用者,价格太高,其实大客户销售和散户销售并没有什么矛盾,这可以参照超星的做法。甚至可以让消费者自己挑选组合,打包购买,比如说购买20种以内,10元一种,20-100种,8元一种,100种以上,5元一种等等,数字化产品的特点就在于初期开发费用极高,但一旦开发完毕,边际成本几乎为零,并不用担心卖得便宜得不偿失。

还有的一个问题是标点。古籍都没有断句,V即使是学古典文学的人也觉得很不方便,应该把所收录的古籍都加上标点。实际上这个 工作 困难并不大,先标点常见的著作,比如国学宝典已经收录的古籍,呵呵,这也算不上抄袭剽窃,国学公司早已是惯犯。其他没人标点国的古籍可以以招标的方式让消费者来做,标点一本书给相应的使用权限即可,总量不过5万,减去他人已经标点过的1万,4万本书在中国找几万几千个网友来标点,并不是什么难事。

前面说到数据的深度挖掘,根据消费者需求排列组合是一种方式,另一种方式则是常用古籍的校注,和中华书局“十三经”、“诸子集成”、“中国古典文学基本丛书”所作的 工作 类似,只是不需要如此专业和详细而已,有人会愿意为这些工作付费。





2007-4-1 21:01:30
 楼主| 发表于 2007-5-28 14:05:45 | 显示全部楼层

回复 #1 东施 的帖子

回复:VIVO是搜神的第一个使用者?说点想法  
一切文本不过是要映入眼帘,印入脑海的符码,所以什么样的载体并不重要,V宁愿要WORD格式的电子文本也不要宋刻本,因为电子文件使用起来高效、快速、便捷。玄奘是古典的hiking大师,非常牛X,令人敬佩,但如果他得知他当年辛苦十几年取回的经书如今几分钟就可以传遍全世界的话,不知道他会不会吐血。V一直爱好数字 图书 ,搜遍了网络,于是很早以前就开始关注爱如生的工作,但和V个人无关,因此不怎么上心,如今貌似爱如生的整个战略有了大变化,就冒个泡支持一下,希望公司发展越来越好。

还有,www.cn-classics.com 全文阅读的IE插件好像有点问题,V下载安装了,却没法使用。  




2007-4-1 21:24:10
 楼主| 发表于 2007-5-28 14:06:27 | 显示全部楼层
回复:VIVO是搜神的第一个使用者?说点想法  
谢谢您提的意见。

全文版本阅读,在window xp 和2000下的ie 6.0 ,火狐, 遨游 浏览器下测试通过。

全文版本阅读需要安装java虚拟机,在你的机器说如果没有安装,在第一次阅读的时候会提示您安装,只要安提示安装就可以,插件安全没风险。

您用的是什么系统和浏览器?我们尽快修改





2007-4-2 10:27:56
 楼主| 发表于 2007-5-28 14:07:09 | 显示全部楼层
回复:回复:VIVO是搜神的第一个使用者?说点想法  
嗯,是我自己的系统有点问题,和网站没关系,现在已经正常。

全文阅读的窗口为什么不能自适应调整大小呢,在1024的分辨率下比较正常,但在1280下就比较难看,偏向一角,有大量空白。 背景 色的花纹太繁复,结果文字读起来比较累,是不是出于防止截屏OCR的考虑呢?用白色就很好,如果想更好,可以设定好几种底色让使用者自由选取。



该贴被91编辑于2007-4-7 6:36:09  




2007-4-6 18:02:12
 楼主| 发表于 2007-5-28 14:07:41 | 显示全部楼层
回复:VIVO是搜神的第一个使用者?说点想法  
呵呵,下载数据而生成的是 图像 文件,这可能是为了防止别人(比如国学网,呵呵)盗用资料吧,但是除了为难了使用者之外意义并不大,确实想大量导出数据的人、机构迟早会找到别的办法,而不是一页页拷。典海网的使用说明太笼统了,有哪些书籍?能否全文、全库检索?可不可以实现和 图像 文件的同页比照?等等等。没有明确的要约,说明各自的权利与义务,没人敢或者愿意稀里糊涂付钱使用。搜神的介绍也有点问题,不足以凸显自己的特色,吸引使用者。
该贴被91编辑于2007-4-6 18:12:38
该贴被91编辑于2007-4-6 18:22:54
 楼主| 发表于 2007-5-28 14:08:15 | 显示全部楼层
回复:VIVO是搜神的第一个使用者?说点想法  
支持vivo的意见,希望允许拷贝比如不超过1000字这样的方式。
希望去掉 背景 里面的爱如生公司的标识,当要满屏阅读而不需上下滑动的时候,背景对文字就造成了影响,当再放大的时候,一屏则不够 显示 ,需要上下滑动,看的十分累。纯色背景好一点,如果必须要有标识,可以隐蔽起来的吗。多谢。

爱如生公司的产品,其实对个人用户只是适合望洋兴叹。呵呵。

多谢。

顺便说一句,其实典海也应该允许每次拷贝一定字数,比如1000字。刚才看了用户须知,似乎正式用户也无权拷贝,这个就有点麻烦的。如果允许拷贝一定字数,我到是想花300元。






2007-4-9 11:38:29
 楼主| 发表于 2007-5-28 14:08:46 | 显示全部楼层
回复:VIVO是搜神的第一个使用者?说点想法  
谢谢你们提的意见:
1.全文版本阅读问题,不能自适应大小,现在我们的阅读器是安1024*748做的,如果1024*768屏幕出现上下滚动条,一般是浏览器被安装了其他插件,出现插件栏导致,把插件栏隐藏即可正常使用。我们会尽快改进这个问题。
2.全文阅读 背景 底纹和下载的问题,是因为一些企业没有商业道德,为了防止这些企业大量拷贝我们的数据(我们的数据是几百人工作了7年的成果)。我们不是针对个人,对个人用户,我们希望越方便越好。我们研究一下改进背景底纹的颜色深度,或可选等。希望能做到方便用户阅读,又能在一定程度上保证我们的数据安全。
3.数据太贵的问题。现在的大部分产品是针对机构的,请大家关注书肆里的数据,我们近期就会上大量针对个人的数据,有很多都只有几十块钱的数据(但是数据是我们自己定义的格式,需要先购买我们的一个小软件书斋,以后就可以任意往书斋里添加数据)。
4.典海的馆藏数据,我们的目标是到5万种 图书 ,但是近期因设备等的原因,不能马上全部上线,我们会陆续的增加。第一批上线的有全文版3千种, 图像 版9千种。近几天就会把上线的书目整理出来,放到馆藏里,方便大家了解。   





2007-4-9 18:02:27
 楼主| 发表于 2007-5-28 14:09:11 | 显示全部楼层
回复:VIVO是搜神的第一个使用者?说点想法  
个人比较看好搜神,至少数据比较精确,而且免费,呵呵
  




2007-4-10 12:10:57
 楼主| 发表于 2007-5-28 14:09:35 | 显示全部楼层
回复:VIVO是搜神的第一个使用者?说点想法  
是Readfree的天人合一?谢谢你的支持,VIVO经常在那里潜水看帖,对大家的ID都很熟悉,正所谓天涯何处不相逢。

允许拷贝1000字不大现实吧,这样的话一本书几分钟就被拷走了,可以适当考虑50-200字的限制,如果彻底不让Copy的话,数字化的意义何在,大家为什么不去看超星扫描的 图像 书呢?愿意在典籍网读电子古典的人,基本上都有点做学术的意图,要收集整理资料,而不仅仅是阅读消遣,这必然会有一个把得到的资料应用到自己写作的问题。如果得到的是图像文件,引用时需要自己再次把它们输入电脑,这未免有些滑稽。爱如生辛辛苦苦把图像OCR成文字,再把它们做成 图像 给读者,然后阅读者二次数字化,那么电脑带来的方便与高效在哪里?

国学网、超星、迪志、方正等都在做数字出版的工作,但就V个人的经验来讲,比较喜欢超星,因为史超不单是一个商人,而且是一个有志于普及文化,让爱书者大量受益的人,是一个有着理想化精神追求的人。大量的人从超星免费盗取数据,史超不是傻子,不会不知道,也不会是他们电脑技术差劲,导致留下无数漏洞,而是史超心存善意,睁只眼闭只眼:只要你喜欢书,喜欢阅读增长知识,你不花钱也没关系,你来偷也没关系,大不了自己多想办法从别的地方赚钱,比如从各种大学机构,从其他数字化工程。

国学网的尹就比较可笑,好像完全被商业利益异化,忘记了自己文化人的身份,自己大量免费利用、偷盗别人的数据,常常连校对的工作都不做就做成 产品 卖钱,却好意思指责南开大学文学院侵权,提供免费电子书。

V说这些闲话,只是想说把老祖宗的东西重新开发赚钱没问题,但也要心存仁义,有回馈利益国民之心,不能全部只考虑商业利润问题。成本弥补、商业收益主要从机构用户那里获得,同时从有需求的个人用户那里收点钱,要是有的人想不花钱而读点书,拷点数据,放他一条生路,而不是赶尽杀绝。
该贴被91编辑于2007-4-10 13:10:05




2007-4-10 13:07:51
 楼主| 发表于 2007-5-28 14:10:06 | 显示全部楼层
回复:回复:VIVO是搜神的第一个使用者?说点想法  
由91发表于2007-4-10 13:07:51 是Readfree的天人合一?谢谢你的支持,VIVO经常在那里潜水看帖,对大家的ID都很熟悉,正所谓天涯何处不相逢。 允许拷贝1000字不大现实吧,这样的话一本书几分钟就被拷走了,可以适当考虑50-200字的限制,如果彻底不让Copy的话,数字化的意义何在,大家为什么不去看超星扫描的 图像 书呢?愿意在典籍网读电子古典的人,基本上都有点做学术的意图,要收集整理资料,而不仅仅是阅读消遣,这必然会有一个把得到的资料应用到自己写作的问题。如果得到的是图像文件,引用时需要自己再次把它们输入电脑,这未免有些滑稽。爱如生辛辛苦苦把 图像 OCR成文字,再把它们做成图像给读者,然后阅读者二次数字化,那么电脑带来的方便与高效在哪里? 国学网、超星、迪志、方正等都在做数字出版的工作,但就V个人的经验来讲,比较喜欢超星,因为史超不单是一个商人,而且是一个有志于普及文化,让爱书者大量受益的人,是一个有着理想化精神追求的人。大量的人从超星免费盗取数据,史超不是傻子,不会不知道,也不会是他们电脑技术差劲,导致留下无数漏洞,而是史超心存善意,睁只眼闭只眼:只要你喜欢书,喜欢阅读增长知识,你不花钱也没关系,你来偷也没关系,大不了自己多想办法从别的地方赚钱,比如从各种大学机构,从其他数字化工程。 国学网的尹就比较可笑,好像完全被商业利益异化,忘记了自己文化人的身份,自己大量免费利用、偷盗别人的数据,常常连校对的工作都不做就做成 产品 卖钱,却好意思指责南开大学文学院侵权,提供免费电子书。 V说这些闲话,只是想说把老祖宗的东西重新开发赚钱没问题,但也要心存仁义,有回馈利益国民之心,不能全部只考虑商业利润问题。成   弥补、商业收益主要从机构用户那里获得,同时从有需求的个人用户那里收点钱,要是有的人想不花钱而读点书,拷点数据,放他一条生路,而不是赶尽杀绝。
该贴被91编辑于2007-4-10 13:10:05



vivo兄好,正是小弟。只不过readfree水平太低,调动不起来兄和dasha兄的发言积极性,哈哈。题外话,题外话。其实上面的枕书庙人也是熟人。哈哈。

也许1000字有点多,诚如v兄所言,200字以内是个好的选择,另外就是典海里面的 图像 阅读,每页都是贯穿页面的大字,十分影响阅读。希望能把这个放在天头和地脚,而不要覆盖在文字上面,虽然是细细的线条,但是很影响阅读的。而且当放大之后,看下一页,图象又返回到默认大小,只好再次调整,这个很累。应该记住当前的选择比例,看下一页的时候还保持上页的放大比例。

还有,应该在进入典海之后,具体看书时,最好是开新页面,不要在原页面直接跳转,或者给予选择,在原页面打开或者到新页面打开。

另外,图象阅读的时候,最好能给出跳转到某卷的选择,跳到某页,因为古书页数不像今日 图书 页数,是标明了的,在核对时候很容易找到的。如果允许跳入某卷,这个就方便多了。例如昨日我核对一条史料,只好估计大约在某页,进去以后还看不到是某卷(因为书中缝很不容易看清楚),实在太麻烦了。转到某页,请允许自己输入页数,而非仅仅是选择。这个能更方便些。

提了如许意见,也许说错,诸位谅之,我昨天花了点时间计算了一下,全部的爱如生 产品 价格,现在有报价的单机版销售价是800多万,如果加上没报价的,是不是得近千万!呵呵。

也许最近打算买个账户呢。再多问句,一个账户允许几个人用呢?还是必须一人一账户?是否限ip?
发表于 2008-1-27 22:10:28 | 显示全部楼层
搜神的数据之广博确实令人感慨,使用几次之后颇有体会。但随之而来也出现了不便之处,如输入某一信息如人名后得到的信息太多,不能马上了解大约有多少条,也无法从中选择自己需要的内容,只能闷着一步一步往下走,点一点出一点,查看完一人资料就要花费几个小时。因同样内容会被后世多种书籍反复引用,这是无法避免的事。不知是否本人使用还有问题?是否能在检索结果设置断代,(但因是外行,说话可能见笑),从使用者的角度来说能对结果有所掌握和控制比较好。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

爱如生国学 ( 京ICP备12023608号 )

GMT+8, 2024-4-29 09:07 , Processed in 0.087500 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表