Почитывая один из форумов, наткнулся на пост о авторегалке акков на gmail.com, подумал что возможно кто-то не читает данный форум и будет полезно запостить ссылочку, помочь нуждающимся. Но поскольку меня последнее время тянет пофилосовствовать я сразу задумался о том что данная авторегалка это офигенный PR новго блога. Делаем выводы применяем.
Неделю бился писав скрипт парсинга одного нужного мне урла и так и не добился нормальных резалтов, прокси ацтой. Скажу сразу парсинг через прокси это жесть, особенно если нужно жёстко проконтролировать 100% пропарсилось или нет. Бился я над этим очень долго и в итоге пришёл к выводу что через паблик прокси это невозможно. Было предложено купить кучу виртуальных хостов и устраивать на них свои прокси и всё равно вариант отсёкся, не купишь же их пару сотен, а 10ком или 20ком не обойдёшься.
Давно пользовался этим замечательным продуктом, но в предыдущих версиях были не дочёты, то с нагрузкой на сервер, то ещё с чем-то поэтому на время от неё отказался т.к. не мог тянуть такие мощьностя. Дня три назад решил поставить версию 5.1 в ней очень порадовала навигация, всё просто и очень удобно, так же порадовали нововведения например из списка проксей можно удалять автоматически листы на которых несколько раз не найдено проксей, есть парсер google хотя эти новинки я так и не попробовал. Через час работы в админку залогинится не получилось, хотя прокси чекались и отдавались рабочими из сгенерированного им урла. Раскочигарил я спамилку VIP с этими проксями и сижу жду логи посмотреть, пока не все потоки поднялись логи были красивыми, что значит что прокси чекер отменно отбирает прокси, но когда в спамилке поднялись все потоки в логах начал замечать что спамилка не может приконектится к урлам из базы. Т.е. лог в основном состоял из Connect to URL Failed! хотя зная принцип работы VIP она для распарсивания формы конектится без прокси. Итого из всей базы проспамились только 10%, осталной нет коннекта. Вот и думаю что наверное на сервере стоит какое-то ограничение на количество коннектов или ещё что. Если кто знает из-за чего это может быть пожалуйста отпишите.
Ну и пост криптум, версия отличная, нагрузку несёт меньше чем старые версии, очень удобная, но не возможно попасть в админку в процессе работы. Для тех кто в танке разговор шёл про http://www.proxy-tool.net/
Месяц назад партнёр приобрёл дорген red.Button 2.16 и я решил его протестировать, в течении месяца я его опробовал сделал некоторые доработки для себя (спасибо автору за открытый код). Дорген порадовал просто мега скоротсной генерацией доров с помощью него было убито более 100 доменов. В итоге использования не знаю почему, но дорген Jonn’a22 индесится медленнее, но даёт гораздо больше траффа чем red.Button с чем это связано не знаю, возможно с алгоритмом генерации текста. Варианты генерации естественно пробовал разные, а так же не юзал старые шаблоны, все делал свои, это касается и редиректа.
Сегодня на обнаруженном мною свежем блоге обноружил интересную информацию по поиску новых кейвордов. Автор описывает как найти такие кейворды, минусом является то что кеи идут все подрят, но думаю можно придумать простенький алгоритм деления кеев по нишам. Например после выполнения всех рекомендаций, берём и составляем самомстоятельно список ниш, а потом кеем или кеями из каждой ниши ищем вхождения в напарсенной базе и получаем тематичную уникальную базу кейвордов! Помоему пока что это золотая жила для кейвордов.
Так же на этом блоге програмисты php могут найти немного полезных сеошных классов.
Попробовав дорген red.Button я почувствовал дикий недостаток в генераторе заданий, решил помочь автору и пользователям доргена и написать простенький генератор заданий для него.
А вообще по мне генер слабоват, делает доры только папочками, овертюру не парсит и перелинковка только внутри одного дора.
Многие дорогостоящие скрипты которые манипулируют траффом можно не покупать если у вас не большие задачи, которые легко решаются с помощью небольших изменений в .htaccess