Traitement de text SQL

Je search des capacités de traitement de text à grande échelle de Microsoft SQL Server (version 2008 R2). Nous sums en train de mettre en place une grande database qui stocke des documents (text). Nous devons produire des résultats de search efficaces basés sur le text stocké dans le (s) tableau (s). Voici un article qui a attiré mon attention et je me request si quelqu'un a réellement mis en œuvre ceci:

http://www.devx.com/dbzone/Article/31339/1954?pf=true

Si vous avez implémenté ceci ou quoi que ce soit de similaire ou même d'autres algorithms de traitement de text, répondez.

Merci.

L'article auquel vous avez lié ne couvre pas vraiment la search de text en soi, bien qu'il fournisse des methods pour faire du traitement de text. Il n'est pas tout à fait clair à partir de la question exactement ce que vous essayez de faire, mais je suppose que vous devez implémenter la fonctionnalité de type moteur de search, où vous renvoyez les résultats les plus pertinents basés sur le text de search. Si tel est le cas et que vous devez implémenter quelque chose uniquement dans SQL Server, vous voudrez probablement searchr la search en text intégral .

Cela dit, je vous recommand fortement d'utiliser Lucene.NET ou Solr (qui utilise la bibliothèque de search Apache Lucene) pour renvoyer des résultats de search efficaces. StackOverflow utilise Lucene.NET pour ses fonctionnalités de search, et il y a une longue discussion à la fin de ce dernier lien sur les avantages et les inconvénients d'utiliser Lucene.NET ou Solr. J'ai utilisé Solr et à mon humble avis, il est beaucoup plus facile de travailler avec et donne de meilleurs résultats que SQL Server avec l'indexing en text intégral. Si vous voulez vraiment une search efficace dans SQL Server, vous allez probablement finir par build la plupart de ce qui est déjà dans Lucene, donc il est probablement plus facile d'utiliser Lucene.NET ou Solr.