Разбор ссылок по анализу данных
22-06-2014 08:42
Интересные ссылки из дайджеста http://habrahabr.ru/post/226641/
- Книги по анализу данных - не про СПО пока мимо.
- Agile Data Science: Building Data Analytics Applications with Hadoop - всё agile, судя по содержанию простой уровень, помимо хадупа куча привычных свободных средств.
- Machine Learning for Hackers - (book_id=666!) - R, спам-фильтр, priority box, прогноз просмотра страниц, рекомендации на kNN, рекомендации по социальному графу, SVM.
- Social Physics: How Good Ideas Spread - должно быть интересно, не нашел pdf, и тут тоже название клевое: The Naked Future: What Happens in a World That Anticipates Your Every Move?
- Developing Analytic Talent: Becoming a Data Scientist - судя по содержанию интересный гайд.
- Anomaly detection technique for sequential data - тоже не нашел pdf.
- Python for Data Analysis - NumPy
- Huge Big Data Poster and Reference - Свободные инструменты: визуализация: D3js, 3js, Gephi, Ozone; анализ: R, Mahout, Titan, OpenCV, Lumify, Hive, Pig, Spark; хранение: HDFS, Accumulo, MongoDB, Cassandra, Titan, Neo4j, MySQL; подготовка (ingest): Storm, Hadoop/MapReduce; инфрастуктура: Linux, OpenShiW, OpenStack, Puppet, Zookeeper, Oozie, HDFS, KaZa, JBoss, Xymon (здесь почти ничего не знаю).
Еще списки ссылок:
tags:
data-mining
comments powered by