Материалы по анализу данных
29-06-2014 11:49
Гайды и инструменты:
scikit + инструкция по выбору алгоритма . + пример рекомендательных систем: Getting started: an introduction to recommender systems with Crab .
A Programmer's Guide to Data Mining - система ррекомендаций на питоне, bayes, k-means
Build a Recommendation Engine with Free, Open Technologies - система рекомендаций на MongoDB, Hadoop, Mortar (Ruby)
Tutorials on topics in machine learning - на около 15 тем, есть еще ссылки на видео-уроки.
7 command-line tools for data science :
jq - sed for JSON
json2csv - convert JSON to CSV
csvkit - suite of utilities for converting to and working with CSV
scrape - HTML extraction using XPath or CSS selectors
xml2json - convert XML to JSON
Rio - making R part of the pipeline+ стандартные : head & tail, wc, grep, sed, sort & uniq, awk
One Page R: A Survival Guide to Data Science with R - статьи и руководства по R
Data Mining Desktop Survival Guide - там же, используют разный софт и R
Data Mining - Algorithms - статистика использования алгоритмов
Guide to Data Science Cheat Sheets - статья на kdnuggets: Selection of the most useful Data Science cheat sheets, covering SQL, Python (including NumPy, SciPy and Pandas), R (including Regression, Time Series, Data Mining), MATLAB, and more.
