Tags，无序，分类和家族相似 - diytz的博客

作者在 2007-05-03 05:07:00 发布以下内容

Tags，无序，分类和家族相似

　　如果你已经看相关的关于Tags的各种说法，我希望你能够暂时忘掉全部的那些解释，之后再重新回忆起来；但如果你还不了解Tags，那么有必要先阅读文章最后留下的链接，然后回到上一步：）

　　那么，什么是Tags？很简单，往下看；

·经典的信息构成模式；

　　在传统的网页组成中，我们通常使用Taxonomy(分类法)来归纳、整理和存放我们的信息，图书馆是一个绝好的例子，所有的信息从一个点开始，形成树状的分类，由此构成一个完整的、相互联系起来逻辑体系；
　　这个体系从一开始就是人为分类形成的，在我们需要检索的时候，几乎不需要费多大的劲；

　　[例子]比如我们的Blog，首先有一个主标题，然后下分若干分类，实际的文章则分类储存在这些不同的分类中；在一般情况下，我们不允许一个文章同时存在于多个分类中，以便于我们管理的方便和检索的唯一性；

　　在网络上,dmoz和wiki都算是比较典型和知名的例子；

·散秩的信息构成模式；

　　看似无序的浩渺信息，其中的绝大部分是通过“语言”来描述的，这表明了这些信息的指向性，因此我们通过提取这些语言（文字、文本）的相同部分，以此获得相关的信息；这些信息平时是完全松散、互不联系的，当且仅当我们对其加以提取的时候才呈现相对紧凑的组织结构，即便如此，这个结构和经典的分类结构相比，仍然是足够散秩的。

　　[例子]你可能已经想到了，Google嘛。目前绝大部分的搜索引擎所依赖的正是这一点，因此对于分词的研究是这些搜索引擎始终的重点和痛苦，其他的不说，仅仅逻辑实证主义和日常语言学派这两个当代的流派就足够他们折腾到下个世纪去了。
　　举一个恶搞点的例子：当我说：“他妈”的时候，仅仅检索关键字而并不关心其在日常语言中实际运用的搜索引擎怎么知道我是在骂人还是在陈诉一个归属性事实呢？更何况我们经常面对google上数万和关键字原本语义要求完全不同的搜索结果长声叹息。

　　[简介]
　　逻辑实证主义：认为人类的日常语言充满的谬误，需要彻底厘平，重构一个像数学一样完美的逻辑语言体系；
　　日常语言学派：认为人类的日常语言是非常合理而符合现实的，“完美”的逻辑语言并不存在而且也不符合现实；唯一的问题在于人们使用日常语言的时候出了一些方法上的问题，这需要我们加以重视和研究。
　　（后者正是我倾向赞同的结论）

·符合未来发展的信息构成模式；

　　现在我们综合起来考察以上两种在我们日常生活中显得日益重要的信息构成模式，会发现他们各有优点和缺陷；
　　对于前者而言，语言所表达和内涵的思想是广博的，构造简单的分类逻辑无法诠释和标识某一篇文章所设计的全部重点，复杂的分类则将陷入无限微观的悖论逻辑；
　　对于后者而言，除开分词的烦恼，Google们也许还希望承天下之大义担负起教导每一个人重修日常语言学分的重任，并且要求每一个人都能达到维特根斯坦的高度。

　　路德维奇·维特根斯坦？对了，这终于回到我们的重点。
　　维特根斯坦本人正是逻辑实证主义和日常语言学派先后的奠基人，而在他的后期的日常语言思想中，他提出了一个大家相对比较熟悉的观点：家族相似。

　　以下引用一段话作大致的解释：