Limitation de la fragmentation sur un index de hachage binary

Je fais (expérimentalement) un projet où je dois merge des données provenant de plusieurs sets de données dans une seule database SQL Server 2012. Certaines données sont dupliquées dans ces sets, et je travaille sur un moyen de détecter et de supprimer les duplicates. Mon test actuel consiste à hacher les éléments de données et à vérifier les hachages en double. Cela semble fonctionner très bien jusqu'ici (s'il y a des collisions de hash, ce n'est pas la fin du monde).

Je stocke ce hachage dans la database en tant que 'binary (32)' et chaque fois que j'ai besoin d'insert une nouvelle ligne (j'utilise en fait un MERGE), je cherche la valeur de hachage et j'insère seulement si elle n'est pas a trouvé. J'ai un index sur la colonne de hachage pour faciliter cette search.

Le problème que j'ai est que l'index est toujours extrêmement fragmenté, et je suis sûr que cela doit ralentir les choses inutilement. Je suppose que cela est dû à la quasi-random des données binarys.

Y a-t-il des options d'index que je pourrais utiliser pour limiter cette fragmentation? Pour le moment, je n'utilise que les valeurs par défaut. Des indices seraient appréciés.

Merci d'avance.

Pas de réponses malheureusement, mais j'ai trouvé que rebuild l'index périodiquement pendant la phase d'insertion a aidé, mais évidemment avec des frais généraux supplémentaires. Cela ne valait pas particulièrement la peine. Je soupçonne que l'expérimentation avec le facteur de remplissage peut aider aussi, mais n'a pas eu le time d'étudier ceci complètement.