| |
Сообщения с тегами: 'парсер текста'

Введен выборочный парсинг контента по ряду признаков. Теперь парсить можно все что угодно.
Как работать с настройками:
1. Ставим галку «Селективный парсинг»
2. Жмем «SelectiveParse». Окрывается окошко с настройками для селективного парсинга.
Подробнее »
| |
15 |
Автор sad-advert
Опубликован 2 сентября 2010
|
|
|

Скрипт серверный, так что ставить надо на денвер.
Собственно хороший контент для дора. Текст вконтакте не индексируется, так что вперед качать Парсер обсуждений vkontakte
| |
10 |
Автор sad-advert
Опубликован 18 августа 2010
|
|
|
| |
1 |
Автор sad-advert
Опубликован 26 июля 2010
|
|
|

Грабинг тематического текста из гугла
Вот еще одна нужная многим дорвейщикам программа. Даем ей кей на русском или на буржуйском языке. Язык программа анализирует сама.
Парсит 10 страниц гугла, выдирает все сниппеты. И сохраняет в папку программы с именем кея.
| |
3 |
Автор sad-advert
Опубликован 26 июля 2010
|
|
|

WebGrabber предназначен для автоматического определения и сбора статей с сайтов. Также положительной стороной скрипта является уникализация полученных статей, что очень важно для поисковых статей. Для сбора статей, Вам нужно указать адрес сайта с нужными статьями, а всё остальное скрипт сделает сам. В результате Вы получите готовые статьи для Ваших сайтов. Так же полученные статьи, Вы можете экспортировать в популярные CMS, например, WordPress, DLE, NewsGrabber и т.д., или сохранить в нужном Вам формате, например, txt, html, xml, sql, rss. Данный скрипт поможет собрать контент для Ваших сайтов и как результат заработать на них с помощью продажи ссылок и\или размещения контекстных объявлений.
Основной принцип:
- Вводите в скрипт url сайта со статьями.
- Скрипт заходит на все страницы сайта и грузит оттуда статьи.
- Скрипт сам отбрасывает мусор со страницы, оставляя только статью.
Вы можете:
- Указать с каких разделов сайта нужно парсить статьи.
- Указать какие слова текст должен содержать (например, окна).
- Указать минимальную длину текста.
- Использовать автоопределение статьи (скрипт сам определит статью на странице), либо можете указать шаблон для парсинга (указываете между какими кусками кода страницы, должен находиться статья).
редактировать полученные статьи, как вручную, так и автоматически.
- Использовать синонимайзер (база 308 000).
- Использовать уникализатор (перевод на английский и обратно), можете использовать автооптимизацию.
- Вставлять автоматически картинки в статьи
- Исользовать шаблоны экспорта в sql (wordpress, dle, joomla, smallnuke) (вы сможете выбрать требуемый шаблон sql чтобы импортировать статьи в движок)
- Указывать максимальное количество статей
Вы можете экспортировать выбранные статьи:
- ТХТ – в текстовый формат. Можете экспортировать в один текстовый файл или в несколько, по шаблону.
- HTML – вы можете указать шаблон для экспорта, на выходе получите архив со страницами.
- XML – скрипт экспортирует все статьи в один правильный XML файл.
- SQL – благодаря экспорту в SQL вы можете использовать полученные статьи практически в любой CMS работающей с БД.
- RSS – самый интересный тип экспорта. Скрипт создает RSS фид и каждые n минут добавляет новую статью. Данный вид экспорта отлично подходит для использования статей в новостных cms, например WordPress, DLE, NewsGrabber…
То что планируем добавить:
- Ручная Оптимизация (вы указываете список кеев, а скрипт сам оптимизирует статьи относительно этого списка)
- Ручная синомизация (вы сможете синонимизировать в полуавтоматическом режиме)
- Экспорт PHP (экспорт в собственную маленькую CMS)
- Статистика онлайн (страница сама будет в режиме реального времени отображать сколько статей отпарсилось…)
- Действия с отмеченными (вы сможете в ручную отметить определенные статьи и обработать их соответствующими действиями такими как вставка картинок, синонимизация, уникализация и т.д.)
| |
6 |
Автор unluck-advert
Опубликован 25 мая 2010
|
|
|
![<br />
<b>Warning</b>: include(/home/bmite/domains/doorway-soft.ru/public_html/wp-content/themes/money-pro/template-alt.php) [<a href='function.include'>function.include</a>]: failed to open stream: No such file or directory in <b>/home/bmite/domains/doorway-soft.ru/public_html/wp-content/themes/money-pro/index.php</b> on line <b>94</b><br />
<br />
<b>Warning</b>: include() [<a href='function.include'>function.include</a>]: Failed opening '/home/bmite/domains/doorway-soft.ru/public_html/wp-content/themes/money-pro/template-alt.php' for inclusion (include_path='.:/usr/local/php5/lib/php') in <b>/home/bmite/domains/doorway-soft.ru/public_html/wp-content/themes/money-pro/index.php</b> on line <b>94</b><br />](http://doorway-soft.ru/wp-content/themes/money-pro/images/0.gif)
![<br />
<b>Warning</b>: include(/home/bmite/domains/doorway-soft.ru/public_html/wp-content/themes/money-pro/template-alt.php) [<a href='function.include'>function.include</a>]: failed to open stream: No such file or directory in <b>/home/bmite/domains/doorway-soft.ru/public_html/wp-content/themes/money-pro/index.php</b> on line <b>101</b><br />
<br />
<b>Warning</b>: include() [<a href='function.include'>function.include</a>]: Failed opening '/home/bmite/domains/doorway-soft.ru/public_html/wp-content/themes/money-pro/template-alt.php' for inclusion (include_path='.:/usr/local/php5/lib/php') in <b>/home/bmite/domains/doorway-soft.ru/public_html/wp-content/themes/money-pro/index.php</b> on line <b>101</b><br />](http://doorway-soft.ru/wp-content/themes/money-pro/images/0.gif)

| |
|