ник: Mak&S
Что-то похожее и мне требовалось - найти двойников в базе по адресу. Я через КЛАДР эту проблему решил. Т.е. я выделяю город в строке адреса, нахожу город в КЛАДР'е, выбираю все улицы этого города из КЛАДР'а, и затем пытаюсь найти выбранные улицы в строке адреса. В итоге получаю код улицы из КЛАДР'а и храню его в базе для последующей проверки на двойников. Проверка получилась долгая, на SQL SERVER 2000 около миллиона записей неделю проверяется и около 75% адресов распознаётся, но даже такой результат очень сильно облегчил жизнь.
Юрия Гагарина и Гагарина Юрия такой метод распознает, а Хо-Ши-Мина и Хошимина - это только ручная правка