搜索研究院


搜索例举

曹溪 2002.10


1、汉语“信息”一词的最早出处

毫无疑问,《辞源》是检索的最佳起点。考虑到手头没多少工具书,我们把GOOGLE作为检索起点的次优选择。
机器不是人,我不会直接在检索框里输入“信息一词最早出自哪里”来问它。先用4个关键词“信息 一词 最早 出自”来试探检索一下。翻了2页,前20个页面中好像都没有。
一篇文章如果写到信息一词的最早出处,估计很可能是依据《辞源》。再用“信息 最早 辞源”检索。OK,在前10项中找到了。“信息”一词最早出自南唐诗人李中《暮春怀故人》中的“梦断美人沉信息,目穿长路依楼台”。再用“李中 暮春怀故人”查得原诗在〈全唐诗〉748卷。
检索结束。


2、曾经看过一个用视觉暂留显示耶稣的图片,有办法从网上找到它吗?

猜测一下,这张图片可能最早出自国外的网站。可英语不怎么样,不知道“视觉暂留”用英语怎么说,只知道里面肯定会有个vision。以“视觉 暂留 vision”为关键词用GOOGLE查得“视觉暂留”的英文是persistence of vision,再以“Jesus persistence vision”为关键词,用GOOGLE图像搜索查得http://www.harmsy.freeuk.com/oimages/thing.gif

据别人说,有个外地出差过来的,晚上闲着没事,随便拿起几张本地晚报打个电话,就能把艺术学院的女学生喊过来。可惜我平时最多帮办公室的同事找找丢了的钥匙,这方面的检索没试过,否则会用它做第3个例子。


3、asdf

无聊之极,在GOOGLE的搜索框里敲一下“asdf”,它肯定不会为你找几首MP3听听或提供几张美女图片养养眼,它提供的第一个查询结果是http://www.asdf.com/。举这么个例子不是扯淡,只是想明确这么一个基本的事实:需求是检索的前提。
三年前我在街上网吧上网,邻座是位30左右的男子,可能是郊区农民。刚一坐下,就问我:“有没有光着腚的?”我开玩笑说:“澡堂子里有。”他接着问的第二个问题是“哪儿能看到广告?”差点让我笑破肚子。其实大部分网络用户的检索需求比这位仁兄多不到哪儿。
我在学校的电子阅览室工作过半年时间。发现学生上网主要是在网易、新浪聊天,看新闻,收发邮件,打游戏,听音乐,看电影,用搜索引擎的很少。他们偶尔也向我问几个问题,比如如何使用WORD,电子邮件的怎么粘上附件,为什么RealPlayer光有图像没有声音(原因:声音控制选了静音;戴了邻座的耳机。),为什么光有声音没有图像(原因:在WINDOWS安全模式下运行的。)只有很少学生问过搜索方面的问题,我一般用GOOLE给查一下算是了事。当然,不能说他们完全没有搜索需求。经常性地清除电脑里的远程拨号程序,说明他们没有办法找到免费的情*色站点,同一段时间内,很多同学上同一个成*人用品网站,说明在信息搜索方面,他们是口头传播互帮互学的。
有位美国的图书馆工作者曾写过一篇文章,内容是关于如何培养用户的信息素养的,题目叫“Real People Don’’t Do Boolean”。对于多数没有太多检索需求的用户来说,学会用两个以上的关键词搜索,就应该算是跨进了网络信息搜索的大门。
如果有一天你打开搜索引擎,实在不知道该搜索什么的时候,就帮我个忙,查查这句说是谁说的:极端的无聊可以用来解除无聊。


4、有谁知道哈利·波特在网上有下载的吗?

《一个解构主义的文本》在那儿下载?
到哪去下载繁体版的25史哪?
请问哪里能下载到《生命中不能承受之轻》的英文版
请问哪里有英文版《在路上》下载的?
哪里有麦田里的守望者的英文版?
问一本书:E.B.White写的那个《Charlotte’’s Web》,哪位DX给个链接?
中文书搜索,可以试试LYCOS的黄金书屋(http://wenxue.lycos.com.cn/),如果找不到,可以用GOOGLE再搜索一下。免费并不意味着没有成本,在电脑上读完一本书很累眼睛的。
至于大部分英文书,除了古腾堡(http://www.gutenberg.org/)的老古董,免费下载的可能性不太大。当然,事情不总是那么绝对。有次刚在论坛跟贴说英文《麦田里的的守望者》无处下载,有人就给了这么个网址:http://mengzhe.vip.sina.com/
顺便插播个广告:我这儿常年销售英文原版书,20元/本(不含邮费) oldstool@sina.com


5、急问:花雕鱼,基围虾怎么翻译?谢谢!

如果不是为了扛杠,就没必要再询问到底是译成什么语言了。
先估计一下,在线汉英词典可能查不到这样的词。所以选GOOGLE做检索起点。
基于这样一种思路:即中文关键词+英文关键的搜索,可以找到某一词语或句子的英文翻译(没错,可以用“三个代表 three”查三个代表的英语怎么说)。虾有小的shrimp和大的prawn两种,先以“基围虾 shrimp”做关键词用GOOGLE搜索。OK,给出的检索结果不到20项,可以大提浏览一下了。
基尾虾的拉丁文是Metapenaeus ensis,英文找到了greasy-back shrimp
和greasyback shrimp,还有Gei Wai Shrimp,最后一个听起来像是饭店菜谱的翻译,可以放弃。在一个大学个人网页http://personal.cityu.edu.hk/~bhworm/Marine%20seafood/seafood/Species/sp9i.htm我们还看到了基围虾Classification的类、属、种,这儿给出的common name是sand pawn,猜测pawn可能拼错了,应该是prawn。
我们已经找到了基围虾的拉丁文Metapenaeus ensis以及两种英文译法。到底那种英文译法准确,我们只能选择更专业一些的学术网站来解决。用“Metapenaeus ensis common name”再查一下,找到的第一个网页是联合国粮农组织的网页,http://www.fao.org/docrep/W2333E/W2333E04.htm,这儿基围虾的common name是greasyback shrimp,第二个网页是带GOV的台湾网页,也是greasyback shrimp,他们都不是学术权威。如果不是写精益求精的学术论文,基围虾的检索到这儿也就大功告吉了。至于花雕鱼怎么译,有兴趣的朋友可以试一试。


6、小饭店让帮着译一下菜谱,“凉拌摘耳根”怎么译?

选择GOOGLE做检索起点,理由与思路同上。
如果拿不准“凉拌”的“凉”是不是cold,可以用“凉拌 +of”做关键词搜索,OF是搜索忽略词,所以前面加上一个“+”强制搜索。
浏览一下查询结果,我们看到有这么多“凉拌”:

凉拌海蜇 Cold & dressed jelly fish
Do you like tossed salad? 你喜欢凉拌生菜吗?.
SALAD:色拉, 凉拌生菜,莴苣、甘蓝、芹菜、洋葱等蔬菜与色拉酱或蛋黄酱搅拌而吃的生菜食品,有时也加些火腿、罐头鱼肉、水果、马铃薯等。也叫“沙拉”
Cold shredded potato with garlic 凉拌土豆丝
Cold mixed vegetables 凉拌素什锦
Cold stir shallot with bean-curd 小葱拌豆腐

用“凉拌 cold”重新搜索,缩小一下范围:
凉拌榨菜 Cold and dressed hot pickled mustard tuber with sauce
凉拌米线 Cold noodles
凉拌粉丝 Seasoned Potato Noodle & Vegetable Cold Platter
凉拌鱿鱼 Cold dish squid
凉拌黄瓜 Shredded cucumber
你有没有做过凉拌黄瓜? Have you ever made cold-dressed cucumbers?
凉拌贡菜 Cold preserved vegetable

这沙拉不是那沙拉,用salad似乎不妥。黄瓜之类强调切片或拍一拍,所以加了个shredded,“凉拌素什锦”、“小葱拌豆腐”等两种以上主原料,强调混和,所以加了mixed,stir。如果是凉拌摘耳根,看来只突出一下“凉”和“调味”就够了,用cold and dressed。

在GOOGLE搜索框键入“摘耳根”,游览给出的检索结果,发现“摘耳根”是四川土话,“鱼腥草”更正规些。再用“鱼腥草”搜索,可以查到“鱼腥草”的拉丁文:
Houuuynia cordate Thunb
Houttuynla cordata Thunb
Houtuynia cordata Thunb
Houttuymia cordata Thuunb
Houttuynia Cordata Thund
Houttuynia Cordata Thunb
还有两个台湾的网页,还提到鱼腥草的英名是Pig thigh

这些鱼腥草的学名里面肯定只有一个对的,浏览更多的网页,我们猜测Houttuynia Cordata Thunb可能是正确的。用“Houttuynia Cordata Thunb Pig thigh”检索,发现只有2个网页,对鱼腥草的英文名字是Pig thigh这种说法我们表示存疑。

为了更准确一些,用“Houttuynia Cordata Thunb”继续检索,给出第1个网页是Plant Profile for Houttuynia cordata Thunb:http://plants.usda.gov/cgi_bin/plant_profile.cgi?symbol=HOCO3
“Classification”给出了鱼腥草的类种属,Scientific Name与 Common Name的对照栏里,查不到它的英文常用名。在网页的最底部,得知这个网页是美国农业部的植物数据库,应该是比较权威和学术的,检索到此结束。

凉拌摘耳根,就译成“Cold and Dressed Zhaiergen”吧。


7、外文书里经常见到这么一句话,A Picture is worth a thousand words . 老外说这是中国人说的。有人把它译成“一画赛千言”、“一幅图象胜过千言万语”,还有的甚至译成“一张图片一千个字节”,想知道这句话的中文出处。

看到A Picture is worth a thousand words译成五花八门的汉语,有点拿着萝卜找不着坑儿的感觉。我在论坛发贴问这个问题的时候,有网友搬出《周易》了里的“书不尽言,言不尽意,圣人立象以尽意” 来解释,这没有用,我要的只是它的源头。

COPY “A Picture is worth a thousand words”做关键词用GOOGLE搜索所有中文网页,嗯,GOOGLE好像被阉得完不成这项任务了。只好换alltheweb(http://www.alltheweb.com)。

在搜索框中COPY一下“A Picture is worth a thousand words”,语言选择Chinese(simp),点一下exact phrase,结果只有8个网页,似乎少点了,猜测可能是句子有误。用“picture +worth +thousand +words”
搜索中文简体网页,发现简体中文网页一般用“One picture is worth a thousand words”

[疯狂短信英语]one picture is worth a thousand words. 百闻不如一见
[英文经典谚语俗语30例详解]One picture is worth a thousand words. 意思是:一张画(或照片)胜过一千字的描写。 如同中国人所说的「百闻不如一见」。(Seeing is better than hearing a hundred times.) (注意:Words are worth a thousands pictures.,又是指一篇文章描写得十分生动)
[李阳工作室]One picture is worth a thousand words. (百闻不如一见。)

克莱斯勒有个广告叫“三家都看看”,再查一下Chinese(trad)和Japanese
[訪客留言簿]一張照片勝過一千個字 (a picture worth a thousand words)
[九歌出版社]在美國時,時常聽到美國人引用的一則中國諺語:?* A picture is worth a thousand-words. ?* 可譯為「一圖值千字。」因此美國人常以圖或畫來代替文字。
絵のめっせーじ "A picture is worth a thousand words."
1 A picture is worth a thousand words. worth:「価値のある」
あめりかの格言に"A picture is worth a thousand words.(百聞は一見にしかず)
A picture is worth a thousand words.《一枚の絵は ... まさる」
What if a picture were worth a thousand words? もしも一枚の絵が千語と同じ ...
でも英語でも言いますね?「百聞は一見にしかず?A picture is worth a thousand words」(なぜ英語では「千」になっているのでしょうか ...
「百聞は一見にしかず?A picture is worth a thousand words」(なぜ英語では「千」になっているのでしょうか ...

根据以上中文简繁体还有日语网页,猜测“百闻不如一见”可能性比较大一些。到底是A picture还是One picture呢,语言选择“any language”,用“exact phrase”搜索,“A picture”是141691个网页,“One picture”是9969个网页。

剩下问题就是在英语网页探寻这句话的源头了。
以“"picture is worth a thousand words" +Chinese +(quote proverb)”搜索全部网页。在英国的Ask a Librarian我们看到有人提过类似的问题。
http://www.ask-a-librarian.org.uk/phrases.html

A picture is worth a thousand words?
One look is worth a thousand words was coined by Fred R. Barnard in Printers' Ink, 8th December 1921, p.96. He changed it to One picture is worth a thousand words in Printers' Ink, 10th March 1927, p.114 and called it "a Chinese Proverb so that people would take it seriously".
Source: The Home Book of Proverbs, Maxims and Familiar Phrases, 1948, edited by Burton Stevenson.

根据这一解答,继续缩小搜索范围,用“"picture is worth a thousand words" +Chinese +Barnard +Printers”搜索,OK,只剩下6个网页

The history of a picture's worth附有图片,可以看到更为详细的介绍。
http://www.cs.uregina.ca/~hepting/proverbial/history.html

1921年Barnard第一次用的是“One Look is Worth A Thousand Words”,说是日本哲学家说的,1927年第二次用的是“One Picture is Worth Ten Thousand Words”,广告旁边的汉字是“画意能达万言”,说是中国谚语。

看完了这篇谚语考正的文章,我们再回到Alltheweb,以“百闻不如一见 +成语”搜索,得知出自《汉书·赵充国传》。

应该说A Picture is worth a thousand words源自“百闻不如一见”,估计也有日本人这个成语的,Barnard开始说来自日本哲学家,也就不足为怪。由于语言的变迁, 汉语的“百闻不如一见”与英语的“A Picture is worth a thousand words”已经分道扬镳,不能互译了。“百闻不如一见”译成英语是“Seeing is better than hearing a hundred times”,“A Picture is worth a thousand words”译成汉语是“一幅图象胜过千言万语”,前面还有个“中国人说”。


8、记得《光荣与梦想》有一处提到约翰列侬的话:“我们比耶稣还吃香”,想知道这句话的原始出处。

从书架上取下商务版《1932-1972年美国实录:光荣与梦想》(第四册),在书后附的《索引》中查Lennon,嗯,没有。再查Beatles,在切口页954,1000,1100,1102,1112中找这句话,半天没找到,靠,原来在1103页:

披头士乐队中的约翰·伦农说,“我们现在比耶稣还吃香。”

在GOOGLE中以“Lennon Jesus than”做关键词,搜索所有网站。很容易检索到1966年3月4日约翰·列侬接受伦敦《Evening Standard》记者Maureen Cleave采访时说过“We're more popular than Jesus Christ now”

"Christianity will go. It will vanish and shrink. I needn't argue with that; I'm right and I will be proved right. We're more popular than Jesus now; I don't know which will go first - rock 'n' roll or Christianity. Jesus was all right but his disciples were thick and ordinary. It's them twisting it that ruins it for me."

美国的青少年杂志《Datebook》7月份一篇文章引用过列侬的话。
http://www.beatlesagain.com/bapology.html网页中我们可以看到《Datebook》的封面,还可以听到列侬为此辩解的部分录音。搜索到这儿该终止了。可当我们返回GOOGLE的检索结果时,又发现了加引号的“The Beatles are bigger than Jesus”,这是不是列侬的原话呢?我们在网页http://www.guardian.co.uk/thebeatles/page/0,11302,607848,00.html提供的披头士大事年表里,查到了如下说法:

March 4, 1966
The London Evening Standard publishes an interview with John Lennon in which he claims that the Beatles are "bigger than Jesus".

为准确起见,需要找到那篇访谈的原文。用“Lennon Jesus London Evening Standard Cleave”再检索一下。在网页http://www.angelfire.com/ia/beatlesfans2/articles/beatlelive.html中我们找到了访谈全文。没有找到“bigger than Jesus”

那么“bigger than Jesus”到底出自哪里呢?以“Lennon bigger than Jesus”为关键词,再检索。还是不能证实“bigger than Jesus”出自列侬之口,大概是以讹传讹。Let it Be,就这样吧。

最后在GOOGLE中键入“BEATLES”,共约有2,160,000项查询结果,再试试“JESUS”试试,和和,共约有13,300,000项查询结果。


(9)托马斯·阿奎那(Thomas Qquinas)曾经很想知道,一个失去处子贞操的女人是否可能回复到她原来的处子状态(Quaestio quodlibetalis, 5.2.3)。阿奎那的答案非常清楚:上帝可能会宽恕她,重新使她获得处子优雅柔美的气质;有时甚至会发生奇迹,上帝会重新给予她肉体上的完整性。但即使是上帝也不能使未曾发生的事情发生,因为违反时间规律有悖于上帝的本性。上帝也不能违反下面的这一逻辑原则:这一原则认为,“P已经发生”与“P没有发生”不可能同时成立。(《诠释与过度诠释》(意)艾柯等著;柯里尼编;王宇根译 三联书店 1997年4月第1版,第34页)

我想知道托马斯·阿奎那的这一论述出自他的什么著作?原文是什么?有英文就可以。

大概是今年5月吧,跟朋友在饭桌上讨论起这个问题,结果惹得旁边的人瞪着眼直看我们。后来我就想查一下托马斯·阿奎那的这段论述的原文。根据译文后面括弧的Quaestio quodlibetalis, 5.2.3,猜测那可能是托马斯·阿奎那原著的拉丁文。以“Quaestio quodlibetalis”做关键词在GOOGLE中查询,找到的网页不多,乱七八糟好几种文字。图省事以“Thomas Aquinas virginity miracle God”作关键词在GOOGLE查询,从网络版《神学大全》里找到了有关论述:
http://www.newadvent.org/summa/315203.htm

昨天又重新做这道题,发现上次的检索是误的。

GOOGLE搜索“Quaestio quodlibetalis”,共约有21项查询结果。有的网页看不懂是什么语言,让人有点晕头转向。不过,可以做出初步判断没有Quaestio quodlibetalis一书的原文。在一个哲学史网页http://www.nd.edu/Departments/Maritain/etext/hwp215.htm,我们可以大提可以了解到13世纪的经院神学论辩除lectiones(有点像大报告厅讲座),还有Quaestio Disputata和Quaestio Quodlibetalis两种形式,前者预定论题,跟课堂上的正方反方差不多,后者是随意发挥,类似于钻牛角尖式的吊诡诘难。 意外的收获对搜索者来说无疑是一种激励。令人高兴的是,在不多的查询结果里,我们找到了英文《诠释与过度诠释》一书全文的PDF(买了中文译本的朋友可以下载对照阅读)。http://www.tannerlectures.utah.edu/lectures/Eco_91.pdf

点一下Adobe Acrobat的文本选择工具,就可以把艾柯的这段COPY下来:
In a Quaestio quodlibetalis, Thomas Aquinas (5.2.3) wonders whether “utrum Deus possit virginem reparare” — in other words, whether a woman who has lost her virginity can be returned to her original undefiled condition. Thomas’s answer is clear. God may forgive and thus return the virgin to a state of grace and may, by performing a miracle, give her back her bodily integrity. But even God cannot cause what has been not to have been, because such a violation of the laws of time would be contrary to his very nature. God cannot violate the logical principle whereby “p has occurred” and “p has not occurred” would appear to be in contradiction. Alea iacta est.

跟中文译本不同的是,5.2.3是跟在”托马斯·阿奎那的名字后,根据Quaestio quodlibetalis前面的不定冠词a,可以判断Quaestio quodlibetalis不是托马斯·阿奎那的著作原名。搞不懂“utrum Deus possit virginem reparare”是什么语,加引号在在GOOGLE中搜索这一短语,只有2个查询结果,都不是托马斯·阿奎那的原著。去掉引号再搜索,找到一个托马斯·阿奎那著作网页http://sophia.unav.es/alarcon/amicis/q05.html
Quodlibet V的Quaestio 2有“Primo utrum Deus possit virginem corruptam reparare”,看样子像是问答形式。返回上一级地址,语言选择“米字旗”,得知这是一个专门研究托马斯·阿奎那的网站,托马斯·阿奎那的全部著作都是拉丁文。在网站INDEX里选择Complete Works,点击Quaestiones de quolibet中的Quodlibet V,噢,就是我们刚才看到的那个网页。
初步猜测艾柯的话可能出自Quaestiones de quolibet一书,但艾柯加引号的拉丁文与本书中的原文不完全一样,而且5.2.3章节也不是恰好完全吻合。我们从艾柯所引的拉丁文中只选2个关键词在这个网站内搜索“virginem reparare site:sophia.unav.es”,有3个网页,除《Quaestiones de quolibet》外,《Compendium Theologiae》与《Scriptum super Sententiis》两部作品的网页看着都不像。

看着拉丁文,有点头大。我们只能说艾柯引的托马斯·阿奎那的话可能出自《Quaestiones de quolibet》一书

德里达曾写过一篇谈翻译的文章叫《巴别塔》,上帝变乱了人类的语言,所以翻译是有悖上帝的意志的。最后我们顺便谈谈艾柯这段话的中文翻译。

(1)In a Quaestio quodlibetalis, Thomas Aquinas (5.2.3) wonders whether “utrum Deus possit virginem reparare” — in other words, whether a woman who has lost her virginity can be returned to her original undefiled condition.

托马斯·阿奎那(Thomas Qquinas)曾经很想知道,一个失去处子贞操的女人是否可能回复到她原来的处子状态(Quaestio quodlibetalis, 5.2.3)。

“wander”译成“很想知道”,显得神学家也太好奇点了吧。是不是应该这样:有一个吊诡问题,让托马斯·阿奎感到不解,是否utrum Deus possit virginem reparare?意思是说一个失去贞洁的女子能否回复到她原来的未玷状态。

(2)Thomas’s answer is clear. God may forgive and thus return the virgin to a state of grace and may, by performing a miracle, give her back her bodily integrity.

阿奎那的答案非常清楚:上帝可能会宽恕她,重新使她获得处子优雅柔美的气质;有时甚至会发生奇迹,上帝会重新给予她肉体上的完整性。
巴别塔 语言 翻译有悖于上帝的意志。

据说有位红学家一张口就是“雪芹”“雪芹”的,不过艾柯用Thomas可不是为了跟大神学家套近乎,提到托马斯·阿奎那,只能是托马斯·阿奎那,托马斯或圣托马斯·阿奎那、圣托马斯,哲学史用的也是托马斯主义。所以译文给改成“阿奎那”是不准确的。“grace”译成“优雅柔美的气质”不妥,这显得上帝做事也忒精细过分了吧,grace指的是蒙恩的状态。“有时甚至会发生奇迹”这么译显得上帝太被动了,译成上帝行使神迹给予肉体上的完整性更好一些。

(3)But even God cannot cause what has been not to have been, because such a violation of the laws of time would be contrary to his very nature. God cannot violate the logical principle whereby “p has occurred” and “p has not occurred” would appear to be in contradiction.

但即使是上帝也不能使未曾发生的事情发生,因为违反时间规律有悖于上帝的本性。上帝也不能违反下面的这一逻辑原则:这一原则认为,“P已经发生”与“P没有发生”不可能同时成立。

我搞不清楚为什么不说“即使是上帝也不能使已经发生的事情未曾发生”?托马斯《神学大全》里关于大嫂变处女的这一段用的也是“For God cannot make that which is done not to have been done”。还望有识之士指点一二。

(4)Alea iacta est.

最后这句中文本漏译。天涯论坛的网友水木乔纳森和bluesea说,根据前后文,应该译成”掷出去的骰子,只能有一种结果”或“这是即成事实”。

说几句别的:

(1)一共写了9个搜索例子,感觉越来越像拿着GOOGLE掉书袋,这可能是因为经常讨论与书有关话题的缘故吧。其实搜索本身就有那么点引经据典认死理的书呆子气。尽管这样,还是希望能做到后续的搜索例子更多样化一些,文章写得更简短一些,介绍搜索引擎与分类目录更多一些。

(2)长时间以来,一直想写篇《GOOGLE葵花宝典》,到现在也没动笔。除工作比较忙外,最主要的原因是在网络信息搜索方面,我也是处在入门阶段。为了让网友早日看到葵花宝典BETA版,我打算近期先写2篇《关于GOOGLE,你需要(不需要)知道的》,算是个准备。

(3)在搜索方面,我从“搜索引擎9238”那儿学到了不少东西。如能经常性切磋讨论,对热爱搜索的网友来说,无疑是极好的启发和提高。给新浪搜索论坛打个广告:http://newbbs2.sina.com.cn/index.shtml?search:search


10、能否查到黄梅“女人与小说”系列文章,印象中是发表在八十年代中后期《读书》杂志上。

用GOOGLE查询“黄梅 女人与小说”,只有3个网页。其中2个网页是“朴素”的个人书架,带berkeley.edu的那个可能就是读书杂志,点一下“网页快照”,得知这是〈读书〉杂志1988年第1期,虽然包含“黄梅”、“ 女人与小说”2个关键词,可是“黄梅”一词是在别人的文章里出现的,后面的《“女人与小说”杂谈之四》像是黄梅的文章,也只有个开头。如果我们对GOOGLE搜索没有更多的了解或者没有听说过网上有20年的《读书》杂志全文,搜索到这儿可能也就终止了。噢,用高级语法指定网域“黄梅 女人与小说 site:tiger.berkeley.edu”?不用多此一举,那是用来缩小搜索范围的。用“黄梅 site:tiger.berkeley.edu”和“女人与小说 site:berkeley.edu”来试探倒还可以。

事实上,如果我们后退返回查询结果页面,点击网址进入网页
http://tiger.berkeley.edu/wdluo/reading/vol-106
从头浏览一遍,是能够找到黄梅的《“女人与小说”杂谈之四》全文的,那为什么网页快照只有文章的开头呢?这与GOOGLE的侦察兵的爬进能力有关,大一点的页面,GOOGLE的SPIDER最多能CRAWL开始的110K文本内容,超过这个范围的,就是invisible,是不能抓取、索引和搜索的。《“女人与小说”杂谈之四》这篇文章,GOOGLE只抓取了标题和开头部分,文章结尾的作者“黄梅”以及本期杂志最后的目录中的“女人与小说”、“黄 梅”是不能抓取和索引的,查询结果里,GOOGLE给这个网页文本大小标注101K。我们开始所以能查到这个页面,也是这2个关键词赶巧碰到一块了。如果没有吕叔湘《葛德文其人》中“今年第八期《读书》上刊出黄梅同志的《玛丽们的命运》”那句话,以“黄梅 女人与小说”为关键词,GOOGLE是搜索不到黄梅的文章的。20年的读书杂志,GOOGLE能搜索的,不过是每期前面三分之一左右的内容。 现在已经找到了“杂谈之四”,网址http://tiger.berkeley.edu/wdluo/reading/vol-106中的vol-106肯定是总期数,可以用直接增加或减少期数的办法来寻找其他各篇,也可以先找总目录。返回上一级地址http://tiger.berkeley.edu/wdluo/reading/点一下Parent Directory,我们知道这是在加州大学伯克莱分校上过学的Weidong Luo的个人网页,点一下contents,噢,找到了《读书》杂志的总目录,这个页面也够长的,看着眼晕,用IE的“编辑”--“查找”(在当前页)”或直接CTRL+F,查不到?呵,那是因为作者名字中间有空格,那就用“女人与小说”查吧。找到了87年第6期(总第99期)、87年第8期(总第101期)、87年第10期(总第103期)、88年第1期(总第106期)。返回http://tiger.berkeley.edu/wdluo/reading/,按总期数找到黄梅的《女人与小说》四篇文章。如果以后还需要查1979-98年《读书》杂志的文章,就收藏这个网址吧,顺便把contents另存为文本文件,下次再找就用不着GOOGLE了。

搜索专家Gary Price说搜索引擎AllTheWeb的SPIDER爬进能力特别强,“Unlike Google and AltaVista, this search engine does not have a limit on the amount of content crawled on a Web page.”,我们可以测试一下。在http://www.alltheweb.com中查询“黄梅 女人与小说”,找到2个网页,全是Berkeley的,《读书》杂志总第99期、106期,标记的文本大小都是125KB,实际上这两个网页的文本内容是290K和266K。

最后的结论是:GOOGLE的SPIDER最多能爬110K的文本,AllTheWeb这方面的能力稍强一点点,专家Price王婆卖瓜式的所谓Priceless Tips也有不靠谱的胡言乱语。

Gary Price的网站
http://www.searchengineshowdown.com/

Web Search Engines FAQS: Questions, Answers, and Issues by Gary Price
http://www.infotoday.com/searcher/oct01/price.htm

本例写作过程中,参阅过季米的贴子《如何查询网上《读书》二十年的文章?》。
http://www.softto.com.cn/books/detail.asp?BBS_ID=822092


11、有很多人名的歌,里面有一个叫“永达”,还有叫“伟业”的;另一首出现了很多人名的歌,里面有一个叫“司空敏慧”;一个常驻广州的摇滚歌手,有一首歌里唱到这样一句:“帮助我复习,做做 这道难题”。一首著名的几乎替代了原唱版的翻唱版歌曲,里面提到了蚌等若干种海鲜。有一首歌说到了“袜子”;一首歌里提到油条了。

有位从图书馆退休的美国老太太Marylaine Block,写了篇《My rules of information》,总结出自个多年积累起来黄金规则,什么“哪儿有上哪儿找”、“问瓜得瓜,问豆得豆”、“找不到多找找”,听起来有点像车轱辘废话,不过这篇文章对信息搜索者来说还是很有启发作用的。其中第5条是Information Is Meaningless Until Queried by Human Intelligence。只有与人的智力活动有关并被提问后,信息才是有意义的。并非所有的提问都与智力活动有关,很明显的例子比如某些所谓的“知识竞赛题”。“1915年箭牌公司给电话号码薄上的每个人送4块口香糖”,知道了这个数据有什么意义呢?

《企鹅信息技术词典》对信息做了狭义与广义的区分,“从其最精确意义上讲,信息据于原始数据(也被称作资料)与知识之间的层位,当它被纳入一定的范围并与特定的问题与决策相关联时,资料就转换成信息。基于这一点,信息可以被界定为‘附着某一意义的事实’”。

GOOGLE搜索“油条 歌词”,找到了好几首:

何勇《钟鼓楼》
水中的荷花 它的叶子已残/倒影中的月亮在和路灯谈判/说着明儿早晨是谁生火做饭/说着明儿早晨是吃油条饼干

宮保雞丁 作詞:陶吉吉/娃娃 作曲:陶吉吉
一大早五點吃完燒餅油條就去耕田 幸福就是規律過一天一天 /我愛這種簡單的感覺 快樂像一盤hot and spicy 宮保雞丁

他的話 詞曲: 蔡藍欽
為何平常熟悉的文字 都變成一團糟 該如何是好 /明天又逃不了老師的燒餅和油條

肉餅飯糰 作詞:周軒 / 作曲:黃韻玲 / 藍心湄
我知道 你星期三吃飯糰 料理和海苔得早起去買/問你要加肉鬆(還)或是吃油條 看我的臉 你說你愛 肉餅飯糰

分享 詞曲:鄭華娟
分享會有痛苦/ 卻能看見心中的美/分享 無聊的時間 分享 冷掉的燒餅油條

大部分歌词用搜索引擎就能解决,搜索引擎搜不到,可以考虑再用指南型分类目录中的歌词搜索网站。搜索中文歌词用关键词(歌手、歌名、某句歌词、专辑名等)加“歌词”一般就能找到,如果给出的搜索结果比较多,可以再考虑通过关键词的增减缩小搜索范围。搜索英文歌词,用关键词+lyrics,比如找六十年代摇滚歌手Janis Joplin的Cheap Thrills专辑的歌词,“Cheap Thrills lyrics”,想找披头士的“黄色潜水艇”,潜水艇一时拼不出来,“beatles yellow lyrics” 。


关于流行歌曲的一个小考试
http://newbbs4.sina.com.cn/newfbin/hotview.cgi?forumid=16&postid=785975
My Rules of Information
http://www.infotoday.com/searcher/jan02/block.htm
我的七条搜索准则
http://www.9238.net/9238/sousuozhunze.htm


12、想听民乐《大海航行靠舵手》,不知道网上能否找到。

在GOOGLE搜索框键入“大海航行靠舵手 民乐”,共有23项查询结果。
找到了“非常发烧网-黑胶唱片”,可打不开网页,试试“网页快照”,靠,又不行了。
http://www.hifi168.com:666/diantai/heijiao.shtml

重新以“大海航行靠舵手 mp3(rm,试听,播放,下载)”再搜索。
用“mp3”搜索时,在“理想之歌 革命音乐空间”找到了《大海航行靠舵手》(历史录音)歌曲与乐曲的MP3
http://hong6666.myetang.com/dhhxkds-2.mp3
http://hong6666.myetang.com/dhhxkds-1.mp3
用“rm”搜索时,在“承德知青网”(http://www.cdzhiqing.com/music.htm)找到的是歌曲用WINDWOS MEDIA PLAYER 播放的,不知道是什么格式音乐文件。
用“试听”搜索时,搜索到的大部分都是手机铃声。
用“下载”搜索时,意外地找到了这首歌的简谱
http://myscore.best.163.com/ddmg3/b15.gif

都没有找到民乐《大海航行靠舵手》,唯一有民乐的的网页就是
http://www.hifi168.com:666/diantai/heijiao.shtml
返回一级网址试试
http://www.hifi168.com:666/diantai/ 不行
http://www.hifi168.com:666 还不行

看着网址里的那个666,有点纳闷。想起了《启示录》里的那个神秘数字。当然不会去翻《圣经》了,找《大海航行靠舵手》靠神的启示也太搞笑了。我电脑与网络方面知识很少,就在新浪搜索论坛发了个贴,询问那个冒号666是什么意思,winbyte说是端口号,还是有点不明白,为什么把端口号设置成了666,GOOGLE查“端号口 666”,结果第1个搜索结果就是“计算机端口详解”,看了半天仍是稀里糊涂。看到端口重定向一节,受到启发,要是不定向。。。?那就去掉666试试
http://www.hifi168.com:666/diantai/heijiao.shtml 仍打不开
http://www.hifi168.com 主页倒是打开了。
在“电台传送”--“黑胶档案”里的找到“大海航行靠舵手”的网页,遗憾的是“在线试听”没有链接音乐文件。

打开舞剧《沂蒙颂》
http://www.hifi168.com:666/music/Yimeng-1.rm
不行,去掉666再试,http://www.hifi168.com/music/Yimeng-1.rm,可以听了。同样的方法再听其他几首,都可以。猜测这个网站可能有《大海航行靠舵手》的音乐文件,所以没有链接可能是在做网页时漏了。
如果猜出《大海航行靠舵手》音乐文件名,还是有可以听到的。看看其他的音乐文件《毛主席著作像太阳》(xiangtaiyang.asf)、《克拉玛伊之歌》(kelamayi.asf)、《交响音乐“沙家浜”之“智斗”》(zhidou.asf)、《我心中的歌献给解放军》(Woxinzhong-1.rm)、《新疆好》(xinjianghao.asf)、舞剧《红色娘子军》选曲(hongsheniangzijun.asf)、《十姐妹打靶》(Shijiemei-1.rm)……
猜测如果格式asf的话,文件名可能是dahai.asf、daihaihang.asf、dahaihangxing.asf、kaoduoshou.asf……
如果格式是rm的话,文件名可能是Dahai-1.rm、Daihang-1.rm、Daihaihangxing-1.rm、Kaoduoshou-1.rm……

试探一会,找到了中央广播文工团民乐管弦乐团的民乐合奏《大海航行靠舵手》
http://www.hifi168.com/music/Dahaihang-1.rm

 

相关链接

曹溪任版主的新浪读书沙龙
http://newbbs4.sina.com.cn/index.shtml?arts:books


“我们若能更妥善地搜寻资料,实在已经改变世界。”

返回首页