Название: "Похожие" строки Отправлено: TemaTre от Май 14, 2012, 07:37 Ребят как сравнить 2 строки на схожесть. Продолжаю свой вопрос по поводу распарсивания строки адреса. Теперь возникла другая проблема необходимо удалить схожие линки. скажем если есть 2 строки http://vk.com/id11111 и http://vk.com/id222222 нужна функция которая скажет на сколько эти строки похожи ну например в процентах. И если эти строки схожи на 60-80% то можно считать что это ссылки ссылаются на аналогичные странички...
Название: Re: "Похожие" строки Отправлено: Bepec от Май 14, 2012, 07:53 Эм... Неужели вы так не хотите думать собственной головой?
Вам же, если не изменяет память, давали даже ссылку на вики. Разбивайте адрес по его структуре. И сравнивайте его части. Сошлось 4 из 5? Возможно ведёт на 1 и ту же страницу. Но уверенности нету и не будет. Как вариант проверяйте куда вас приведёт по этой ссылке. И сранивайте уже результат перехода. PS ленивец. Название: Re: "Похожие" строки Отправлено: sudo от Май 14, 2012, 10:23 Расстояние Левенштейна должно помочь
http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D0%B5_%D0%9B%D0%B5%D0%B2%D0%B5%D0%BD%D1%88%D1%82%D0%B5%D0%B9%D0%BD%D0%B0 (http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D0%B5_%D0%9B%D0%B5%D0%B2%D0%B5%D0%BD%D1%88%D1%82%D0%B5%D0%B9%D0%BD%D0%B0) Код
|