Tuesday, February 08, 2011

一切都是离散

VV说介绍连续和离散的变量就把学生搅晕了。这问题我也遇到。对我那些不说也罢的学生,我说,你在持续不断的成长和衰老,不是到过生日那天忽然一下子老去一岁,虽然为方便,我们可能都用整数来表示年龄。这个相对来说是一个比较浅显的例子。

其实说到底,一切,都是离散的。真正的连续,或无限可分(一尺之棰日取其半万世不竭)只存在于数学里,不在我们这个物质世界。水连续吗?一杯水分到最后还是变成了水分子。再往下分就不是水了。时间是否连续貌似有争议,我是离散派的。

应我要求,camer推荐了一本讲佛教宇宙学的书。他说浅显易懂。我上当了。看到三千大千世界的梵文音译(Trisahasramahasahasralokadhatu)的时候我抽了一口冷气 (加几个hyfen会死吗?)。这本书开篇提到“十四无记”,是佛不去回答的问题。光是提出这十四个问题,就让我看到佛教的高明了:问出宇宙有限吗?无限吗?不算本事,但提出宇宙是“即有限又无限”这种可能性,我想对于佛来说,接受波粒二相性一定不是什么难事。

怎么既无限又有涯呢?我知道下面这个比方没什么道理,对于我它就是很形象-- 因为我梦见了。(0,1)给人的感觉比较无涯,因为似乎到了0.9还可以0.99,还可以0.999 (想起那个说兔子永远追不上乌龟的诡辩了)。[0,1]其实比(0,1)大,但马上给人有涯的感觉了。我想,[0,1]这样一个线段算是既有限又无限吧。长度有限,但是里面风光无限。

长度无限却仍然给我有限感的集合呢?譬如所有从偶数起到奇数止的线段,....[-2,-1],[0,1],[2,3],[4,5],......

我梦见我是生活在 [0,1] 之间的一个小虫。这样的小虫出生在0,1之间的一个点上,平常都在出生地附近的一个很小区间走动直到老死。我忽然悟了道可以在整个[0,1]自由行走。整个[0,1]啊,上面的所有点啊!但是走到边上也就碰壁了。宇宙虽然还包含无穷多更多的线段,但是,中间隔着虚无,我就是过不去。或者说,我只是认为宇宙中完全有可能还包含无穷多的线段,譬如说,[2,10],[100,100.1], 又或者,某个数以外是一直连续的[N,∞)。谁知道呢? 我去不了,也没有谁来过。

这当然不是佛说的既有限又无限的意思。佛是啥意思他也不肯说,他说,这与解脱无关。

Monday, February 07, 2011

为什么



偶然哼起许美静的一首歌,“往事就像流星划过心房”,忽然想到,为什么文学里提到心,只有心房,从来没有心室呢?心房这个词是什么时候出现的?其实放歌词里还好理解,因为房字发音比较饱满,比室字圆润开放。但是为什么其他形式的文学作品里也永远都是心房呢?

心有粗细,有开关,痛心,热心,揪心,还有一个窝心在大陆是堵的意思,在台湾是体贴的意思。

五脏六腑里面,肺好像好的时候就如同无形。坏了撕心裂肺。
脾是管脾气,胆是管胆量。肝呢?好像只有惊恐到肝儿颤--这个我还没体会过。
肠是用来后悔的(悔得肠子都青了)。

Thursday, February 03, 2011

从我的搜索习惯看google和bing的是非

google给bing下了个套,我们有热闹看了。

今天忍不住看了一下这个套儿的具体描述,比广播里的稍细节一些。

google设计了100个伪字,基本上不会有人去查询的,然后人工给这些伪字强行嫁接了风马牛不相及的google搜索结果。刚开始,bing搜索不会出这些结果,但几个星期以后,bing也返还这些人为嫁接的网站---- 如果故事仅仅是这样,bing照搬google结果是很说服我的。

现在补充一点中间的过程:为了成功钓鱼,google还派了20个工程师装上IE和bing工具栏,搜索这些伪字,并且点击这些伪字的搜索结果---- 这个我认为是关键。有人点击,那就是说从表面上看起来是有活人认可了这些伪字和搜索结果的关联。Bing正是用点击来调整搜索结果的-- 他们也承认了这一点。从算法上我觉得蛮有用-- 这不等于是把人肉搜索利用起来了么!Bing当然不会说,用人肉数据的时候我们只利用那些使用bing的人群,那不等于白白浪费很多数据?而google的用户如果自己同意MS搜集点击数据,那也轮不到google来哭不公平。虽然我认为google可以嘲笑bing。。。。

事实上,用任何一个搜索工具出来的结果,我都不是永远认为第一条最好最相关。有时候,搜索比较奇怪的东西,甚至需要翻好几页才能发现自己要找的东西。如果bing通过搜集点击率来重新排序,相当于利用人海战术来确认和校正搜索结果的相关性。问题是,似乎bing利用点击重新排序的过程做得不够巧妙。譬如说,同一个人如果反复这样做,其实是应该降低权重的。还有,我经常看了搜索结果页上的两句网页节选,以为有用,点开以后发现其实不对,然后马上又退出来继续看其他搜索结果。不知道这个在其他网站上的停留时间是否也容易记录,如果是,也应该利用起来。如果一个网页本来只排第五,但是成千上万的人都在搜索后优先点开这个并且长期停留,那这个网页就是网民投票的第一了。以前google的想法是靠链接来说话,Bing要参考沉默的大多数的意见,思路没错。

---- 我不持有google或MS的股票,我就是喜欢看热闹。搜索如果以后只有google一家做就没劲了。

---- 一个技术问题:如果有人做了一个google bomb,但是搜索-->点击率不高,在bing上面能避免成为bomb吗?