实验终于出了点结果
收藏此页到365KeyPublished on 03/21,2007
如果说去年的冬春交际是在 nklog 的筹建工作中度过,今年的第一个季度基本上献给了博客论文的实验工作,原计划在春节前完成的实验系统到今天才算出了点结果,真是看来容易做来难。

上面的截图是实验结果的一部分,第 1 列为序值,第 4 列为人工标注的文章与主题的相关度(1 表示不相关,2 表示部分相关,3 表示全相关)。可以看出前 15 个结果中相关的文章有 7 篇,还算过得去。只可惜 3 分的文章太少,只有 1 个,得想办法优化才是。
最开始以为博客文章排序很好做,后来才发现尽管排序算法非常直观,但很多具体细节自己实现起来还是非常麻烦的,尤其是在网页数据预处理的过程中,很多地方隐藏着不可预知的麻烦。尽管每个小问题都不很困难,合在一起却变成一团乱麻,如果再碰上以前开小差没弄懂的东西,就只有后果自负了……
实验做到现在,更深刻地理解“书到用时方恨少”的道理,该学东西的时候就拼命学,当时学不好不会怎样,后来做事时才一起算总账。
本文引用地址(Trackback URL)
http://www.nklog.org/trackback.php?id=5621


03/22,2007, at 10:56
真是这样的,现在我越写越想读书了。。。
03/22,2007, at 11:28
:-D 别担心,还有句话叫做“纸上得来终觉浅,绝知此事要躬行”啊,咱们是从实战场上学起来的,比别一般学生更有实践经验啊
03/22,2007, at 22:21
恩,慢慢做起来确实比较有成就感。。
03/23,2007, at 00:48
:-p 成就感…… 我现在就没什么成就感,不过还是得继续做下去,直觉告诉俺早晚能用到的