仓库

mGalarnyk 的仓库

Nearly 3 million rows of auto accidents in the USA over several years. I'm trying to do a barplot race....

最近提交 2020年4月22日

 (2 stars) (3 forks) (0 个已索引 issue) (0 个开放 good first issue)

Homework/Classwork for my DSE 200 Python for Data Analysis Class at UC San Diego (UCSD)

最近提交 2016年8月4日

 (102 stars) (85 forks) (0 个已索引 issue) (0 个开放 good first issue)

Database Management Systems Data Science Masters Course (DSE 201)

最近提交 2016年6月26日

 (12 stars) (9 forks) (0 个已索引 issue) (0 个开放 good first issue)

Probability and Statistics Using Python Data Science Masters Course at UCSD (DSE 210)

最近提交 2017年8月21日

 (181 stars) (126 forks) (0 个已索引 issue) (0 个开放 good first issue)

Repo for my graduate data science machine learning class at UCSD (UC San Diego). This course provides a broad introduction to the practical side of machine-learning and data analysis. The topics covered in this class include topics in supervised learning, such as k-nearest neighbor classifiers, decision trees, boosting and perceptrons, and topics in unsupervised learning, such as k-means, PCA and Gaussian mixture models.

最近提交 2018年3月26日

 (54 stars) (38 forks) (0 个已索引 issue) (0 个开放 good first issue)

Map-reduce, streaming analysis, and external memory algorithms and their implementation using the Hadoop and its eco-system: HBase, Hive, Pig and Spark. The class will include assignment of analyzing large existing databases.

最近提交 2017年4月3日

 (34 stars) (22 forks) (0 个已索引 issue) (0 个开放 good first issue)

最近提交 2021年8月6日

 (24 stars) (10 forks) (0 个已索引 issue) (0 个开放 good first issue)

Interview stuff for friends

最近提交 2022年1月25日

 (84 stars) (63 forks) (0 个已索引 issue) (0 个开放 good first issue)

最近提交 2026年3月10日

 (0 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

Installations for Data Science. Anaconda, RStudio, Spark, TensorFlow, AWS (Amazon Web Services).

最近提交 2023年1月24日

 (235 stars) (163 forks) (0 个已索引 issue) (0 个开放 good first issue)

最近提交 2025年2月11日

 (0 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

Resources for my LinkedIn Learning Courses

最近提交 2023年7月18日

 (1 star) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

GitHub Repo for MGT-6090 Assignment 8 BHC.

最近提交 2023年11月15日

 (0 stars) (1 fork) (0 个已索引 issue) (0 个开放 good first issue)

最近提交 2026年4月27日

 (7 stars) (3 forks) (0 个已索引 issue) (0 个开放 good first issue)

Coursera machine learning specialization coursework (python based, University of Washington).

最近提交 2016年3月28日

 (18 stars) (20 forks) (0 个已索引 issue) (0 个开放 good first issue)

最近提交 2016年6月26日

 (3 stars) (6 forks) (0 个已索引 issue) (0 个开放 good first issue)

Python tutorials in both Jupyter Notebook and youtube format.

最近提交 2026年4月17日

 (1,256 stars) (1,133 forks) (0 个已索引 issue) (0 个开放 good first issue)

Shingho is a PySpark based statistical library designed for Big Data applications.

最近提交 2017年4月17日

 (1 star) (1 fork) (0 个已索引 issue) (0 个开放 good first issue)

This is a repo to keep the data for my tutorials. This is to make it so people dont need a Kaggle account and such as much as possible.

最近提交 2026年2月15日

 (9 stars) (4 forks) (0 个已索引 issue) (0 个开放 good first issue)

Legally allowable public portion of the UCSD Extension course: Data Analytics Using Python (CSE-41204)

最近提交 2023年9月15日

 (7 stars) (4 forks) (0 个已索引 issue) (0 个开放 good first issue)