Автор:
SA
|
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
Автоматизированный сбор данных из интернета существует столько же, сколько сам интернет. Несмотря на то что веб-скрапинг (web scraping) – не новый термин, еще недавно это направление имело другое определение деятельности: интеллектуальный анализ данных (data mining), сбор веб-данных (web harvesting). Веб-скраперы могут проникнуть в такие места, куда традиционные поисковые системы попасть не могут. Веб-скрапинг и программирование позволяют извлекать данные из веб-сайтов и делать с ними все, что захочется. В книге показано, как скрапить веб-сайт с помощью всего лишь нескольких строк кода на Python для наших целей. Примеры программного кода, приведенные в книге, будут разбираться в этих принципах на практике.
|
- Автор: Райан Митчелл
- Издательство: ДМК Пресс
- Год издания: 2016
- Количество страниц: 272
- ISBN: 978-5-97060-223-2
- Цена: 649 руб.
|
Очевидно, что существует очень много практических сфер, где требуется доступ к данным почти не ограниченного объема. Прогнозирование рынка, машинный перевод и даже медицинская диагностика уже извлекли огромную пользу, воспользовавшись возможностью собрать и проанализировать данные новостных сайтов, переведенный контент и сообщения на медицинских форумах.
Данные – это ядро предсказательного моделирования, визуализации и анализа. К сожалению, нужные данные не всегда легко доступны пользователю, чаще всего они неструктурированны. Самым большим источником данных является интернет. Инструменты и примеры, приведенные в этой книге, позволяют легко автоматизировать несколько повторяющихся задач, высвобождая время для решения более насущных проблем. Это легко читаемая, ориентированная наконкретный результат книга, рассказывающая о реальных проблемах и решениях. Редко встретишь проблему, которую невозможно решить, когда дело доходит до автоматизированного сбора данных в интернете. Просто помните: интернет – это один гигантский API с несколько скудным пользовательским интерфейсом.
Книга «Скрапинг веб-сайтов с помощью Python» идеально подходит для программистов, специалистов по безопасности и веб-администраторов, знакомых с языком.
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
|