Notebook IPython mendemonstrasikan fungsionalitas pembelajaran mendalam.
Tutorial TensorFlow tambahan:
Buku catatan | Keterangan |
---|---|
tsf-dasar-dasar | Pelajari operasi dasar di TensorFlow, sebuah perpustakaan untuk berbagai jenis tugas pemahaman persepsi dan bahasa dari Google. |
tsf-linier | Menerapkan regresi linier di TensorFlow. |
tsf-logistik | Menerapkan regresi logistik di TensorFlow. |
tsf-nn | Implementasikan tetangga terdekat di TensorFlow. |
tsf-alex | Menerapkan AlexNet di TensorFlow. |
tsf-cnn | Menerapkan jaringan neural konvolusional di TensorFlow. |
tsf-mlp | Menerapkan perceptron multilapis di TensorFlow. |
tsf-rnn | Menerapkan jaringan neural berulang di TensorFlow. |
tsf-gpu | Pelajari komputasi multi-GPU dasar di TensorFlow. |
tsf-gviz | Pelajari visualisasi grafik di TensorFlow. |
tsf-lviz | Pelajari visualisasi kerugian di TensorFlow. |
Buku catatan | Keterangan |
---|---|
tsf-bukan-mnist | Pelajari kurasi data sederhana dengan membuat acar dengan set data yang diformat untuk pelatihan, pengembangan, dan pengujian di TensorFlow. |
tsf-terhubung sepenuhnya | Latih model yang lebih dalam dan akurat secara progresif menggunakan regresi logistik dan jaringan neural di TensorFlow. |
regularisasi tsf | Jelajahi teknik regularisasi dengan melatih jaringan yang terhubung sepenuhnya untuk mengklasifikasikan karakter notMIST di TensorFlow. |
konvolusi tsf | Buat jaringan neural konvolusional di TensorFlow. |
tsf-word2vec | Latih model skip-gram melalui data Text8 di TensorFlow. |
tsf-lstm | Latih model karakter LSTM melalui data Text8 di TensorFlow. |
Buku catatan | Keterangan |
---|---|
theano-intro | Pengantar Theano, yang memungkinkan Anda mendefinisikan, mengoptimalkan, dan mengevaluasi ekspresi matematika yang melibatkan array multidimensi secara efisien. Itu dapat menggunakan GPU dan melakukan diferensiasi simbolik yang efisien. |
pemindaian theano | Pelajari pemindaian, mekanisme untuk melakukan loop dalam grafik Theano. |
theano-logistik | Menerapkan regresi logistik di Theano. |
theano-rnn | Menerapkan jaringan saraf berulang di Theano. |
theano-mlp | Menerapkan perceptron multilayer di Theano. |
Buku catatan | Keterangan |
---|---|
keras | Keras adalah perpustakaan jaringan saraf sumber terbuka yang ditulis dengan Python. Ia mampu berjalan di atas Tensorflow atau Theano. |
pengaturan | Pelajari tentang tujuan tutorial dan cara mengatur lingkungan Keras Anda. |
intro-pembelajaran mendalam-ann | Dapatkan pengenalan pembelajaran mendalam dengan Keras dan Jaringan Syaraf Tiruan (ANN). |
theano | Pelajari tentang Theano dengan menggunakan matriks bobot dan gradien. |
keras-otto | Pelajari tentang Keras dengan melihat tantangan Kaggle Otto. |
Ann-mnist | Tinjau implementasi sederhana ANN untuk MNIST menggunakan Keras. |
jaringan konv | Pelajari tentang Convolutional Neural Networks (CNN) dengan Keras. |
konv-net-1 | Mengenali angka tulisan tangan dari MNIST menggunakan Keras - Bagian 1. |
konv-net-2 | Mengenali angka tulisan tangan dari MNIST menggunakan Keras - Bagian 2. |
keras-model | Gunakan model terlatih seperti VGG16, VGG19, ResNet50, dan Inception v3 dengan Keras. |
pembuat enkode otomatis | Pelajari tentang Autoencoder dengan Keras. |
rnn-lstm | Pelajari tentang Jaringan Neural Berulang (RNN) dengan Keras. |
lstm-kalimat-gen | Pelajari tentang RNN menggunakan jaringan Long Short Term Memory (LSTM) dengan Keras. |
Buku catatan | Keterangan |
---|---|
mimpi yang mendalam | Program visi komputer berbasis Caffe yang menggunakan jaringan saraf konvolusional untuk menemukan dan menyempurnakan pola dalam gambar. |
Notebook IPython mendemonstrasikan fungsionalitas scikit-learn.
Buku catatan | Keterangan |
---|---|
intro | Buku catatan pengantar untuk belajar scikit. Scikit-learn menambahkan dukungan Python untuk array dan matriks multidimensi yang besar, bersama dengan perpustakaan besar fungsi matematika tingkat tinggi untuk beroperasi pada array ini. |
tahu | Terapkan k-tetangga terdekat di scikit-learn. |
linier-reg | Menerapkan regresi linier di scikit-learn. |
svm | Menerapkan pengklasifikasi mesin vektor dukungan dengan dan tanpa kernel di scikit-learn. |
hutan acak | Terapkan pengklasifikasi dan regresi hutan acak di scikit-learn. |
k-berarti | Menerapkan pengelompokan k-means di scikit-learn. |
pc | Menerapkan analisis komponen utama di scikit-learn. |
gmm | Menerapkan model campuran Gaussian di scikit-learn. |
validasi | Menerapkan validasi dan pemilihan model di scikit-learn. |
Notebook IPython menunjukkan inferensi statistik dengan fungsionalitas SciPy.
Buku catatan | Keterangan |
---|---|
ilmu pengetahuan | SciPy adalah kumpulan algoritma matematika dan fungsi kenyamanan yang dibangun di atas ekstensi Numpy dari Python. Ini menambah kekuatan signifikan pada sesi Python interaktif dengan menyediakan perintah dan kelas tingkat tinggi kepada pengguna untuk memanipulasi dan memvisualisasikan data. |
ukuran efek | Jelajahi statistik yang mengukur besarnya efek dengan menganalisis perbedaan tinggi badan antara pria dan wanita. Menggunakan data dari Behavioral Risk Factor Surveillance System (BRFSS) untuk memperkirakan rata-rata dan deviasi standar tinggi badan untuk wanita dan pria dewasa di Amerika Serikat. |
contoh | Jelajahi pengambilan sampel secara acak dengan menganalisis rata-rata berat badan pria dan wanita di Amerika Serikat menggunakan data BRFSS. |
hipotesa | Jelajahi pengujian hipotesis dengan menganalisis perbedaan bayi sulung dibandingkan dengan bayi lainnya. |
Notebook IPython mendemonstrasikan fungsionalitas panda.
Buku catatan | Keterangan |
---|---|
panda | Pustaka perangkat lunak yang ditulis untuk manipulasi dan analisis data dengan Python. Menawarkan struktur data dan operasi untuk memanipulasi tabel numerik dan deret waktu. |
perselisihan data-github | Pelajari cara memuat, membersihkan, menggabungkan, dan merekayasa fitur dengan menganalisis data GitHub dari repo Viz . |
Pengantar-Panda | Pengantar Panda. |
Memperkenalkan-Objek-Panda | Pelajari tentang objek Pandas. |
Pengindeksan dan Seleksi Data | Pelajari tentang pengindeksan dan pemilihan data di Pandas. |
Operasi-di-Panda | Pelajari tentang mengoperasikan data di Pandas. |
Nilai yang Hilang | Pelajari tentang menangani data yang hilang di Pandas. |
Pengindeksan Hierarki | Pelajari tentang pengindeksan hierarki di Pandas. |
Concat-Dan-Tambahkan | Pelajari tentang menggabungkan kumpulan data: menggabungkan dan menambahkan di Pandas. |
Gabung-dan-Gabung | Pelajari tentang menggabungkan kumpulan data: gabungkan dan gabung di Pandas. |
Agregasi-dan-Pengelompokan | Pelajari tentang agregasi dan pengelompokan di Pandas. |
Tabel Pivot | Pelajari tentang tabel pivot di Pandas. |
Bekerja-Dengan-String | Pelajari tentang operasi string yang divektorkan di Pandas. |
Bekerja dengan Rangkaian Waktu | Pelajari tentang bekerja dengan deret waktu di panda. |
Evaluasi Kinerja dan Kueri | Pelajari tentang Panda berperforma tinggi: eval() dan query() di Pandas. |
Notebook IPython mendemonstrasikan fungsionalitas matplotlib.
Buku catatan | Keterangan |
---|---|
matplotlib | Pustaka plot 2D Python yang menghasilkan angka kualitas publikasi dalam berbagai format hardcopy dan lingkungan interaktif di seluruh platform. |
matplotlib diterapkan | Terapkan visualisasi matplotlib ke kompetisi Kaggle untuk analisis data eksplorasi. Pelajari cara membuat plot batang, histogram, subplot2grid, plot yang dinormalisasi, plot sebar, subplot, dan plot estimasi kepadatan kernel. |
Pengantar-Ke-Matplotlib | Pengantar Matplotlib. |
Plot Garis Sederhana | Pelajari tentang plot garis sederhana di Matplotlib. |
Plot-Sebar-Sederhana | Pelajari tentang plot sebar sederhana di Matplotlib. |
Bilah kesalahan.ipynb | Pelajari tentang memvisualisasikan kesalahan di Matplotlib. |
Plot Kepadatan dan Kontur | Pelajari tentang plot kepadatan dan kontur di Matplotlib. |
Histogram-dan-Binning | Pelajari tentang histogram, binning, dan kepadatan di Matplotlib. |
Menyesuaikan-Legenda | Pelajari tentang menyesuaikan legenda plot di Matplotlib. |
Menyesuaikan-Bilah Warna | Pelajari tentang menyesuaikan bilah warna di Matplotlib. |
Banyak Subplot | Pelajari tentang beberapa subplot di Matplotlib. |
Teks-dan-Anotasi | Pelajari tentang teks dan anotasi di Matplotlib. |
Menyesuaikan-Kutu | Pelajari tentang menyesuaikan centang di Matplotlib. |
Pengaturan-dan-Stylesheet | Pelajari tentang mengkustomisasi Matplotlib: konfigurasi dan stylesheet. |
Plot Tiga Dimensi | Pelajari tentang pembuatan plot tiga dimensi di Matplotlib. |
Data-geografis-dengan-peta dasar | Pelajari tentang data geografis dengan peta dasar di Matplotlib. |
Visualisasi-Dengan-Seaborn | Pelajari tentang visualisasi dengan Seaborn. |
Notebook IPython mendemonstrasikan fungsionalitas NumPy.
Buku catatan | Keterangan |
---|---|
numpy | Menambahkan dukungan Python untuk array dan matriks multidimensi yang besar, serta perpustakaan besar fungsi matematika tingkat tinggi untuk beroperasi pada array ini. |
Pengantar-untuk-NumPy | Pengantar NumPy. |
Pemahaman-Tipe Data | Pelajari tentang tipe data dengan Python. |
Dasar-dasar-Dari-NumPy-Array | Pelajari tentang dasar-dasar array NumPy. |
Fungsi komputasi-pada-array | Pelajari tentang komputasi pada array NumPy: fungsi universal. |
Agregat komputasi-on-array | Pelajari tentang agregasi: min, maks, dan segala sesuatu di antaranya di NumPy. |
Penyiaran komputasi-pada-array | Pelajari tentang komputasi pada array: penyiaran di NumPy. |
Boolean-Array-dan-Mask | Pelajari tentang perbandingan, masker, dan logika boolean di NumPy. |
Pengindeksan Mewah | Pelajari tentang pengindeksan mewah di NumPy. |
Penyortiran | Pelajari tentang pengurutan array di NumPy. |
Data Terstruktur-NumPy | Pelajari tentang data terstruktur: array terstruktur NumPy. |
Notebook IPython mendemonstrasikan fungsionalitas Python yang diarahkan pada analisis data.
Buku catatan | Keterangan |
---|---|
struktur data | Pelajari dasar-dasar Python dengan tupel, daftar, dicts, set. |
utilitas struktur data | Pelajari operasi Python seperti pemahaman irisan, rentang, xrange, membagi dua, mengurutkan, mengurutkan, membalikkan, menghitung, zip, daftar. |
fungsi | Pelajari tentang fitur Python tingkat lanjut: Fungsi sebagai objek, fungsi lambda, penutupan, *args, **kwargs currying, generator, ekspresi generator, itertools. |
tanggalwaktu | Pelajari cara bekerja dengan tanggal dan waktu Python: datetime, strftime, strptime, timedelta. |
pencatatan | Pelajari tentang logging Python dengan RotatingFileHandler dan TimedRotatingFileHandler. |
pdb | Pelajari cara melakukan debug dengan Python dengan debugger kode sumber interaktif. |
tes satuan | Pelajari cara menguji dengan Python dengan pengujian unit Nose. |
Notebook IPython digunakan dalam kompetisi kaggle dan analisis bisnis.
Buku catatan | Keterangan |
---|---|
raksasa | Memprediksi kelangsungan hidup di Titanic. Pelajari pembersihan data, analisis data eksplorasi, dan pembelajaran mesin. |
analisis churn | Memprediksi churn pelanggan. Latihan regresi logistik, pengklasifikasi peningkat gradien, mesin vektor pendukung, hutan acak, dan k-tetangga terdekat. Mencakup diskusi tentang matriks konfusi, plot ROC, kepentingan fitur, probabilitas prediksi, dan kalibrasi/deskriminasi. |
Notebook IPython mendemonstrasikan fungsionalitas percikan dan HDFS.
Buku catatan | Keterangan |
---|---|
percikan | Kerangka kerja komputasi cluster dalam memori, hingga 100 kali lebih cepat untuk aplikasi tertentu dan sangat cocok untuk algoritma pembelajaran mesin. |
hdfs | Menyimpan file berukuran sangat besar secara andal di seluruh mesin dalam cluster besar. |
Notebook IPython mendemonstrasikan Hadoop MapReduce dengan fungsionalitas mrjob.
Buku catatan | Keterangan |
---|---|
mapreduce-python | Menjalankan pekerjaan MapReduce dengan Python, menjalankan pekerjaan secara lokal atau di cluster Hadoop. Mendemonstrasikan Streaming Hadoop dalam kode Python dengan pengujian unit dan file konfigurasi mrjob untuk menganalisis log bucket Amazon S3 di Elastic MapReduce. Disco adalah alternatif berbasis python lainnya. |
Notebook IPython mendemonstrasikan Amazon Web Services (AWS) dan fungsionalitas alat AWS.
Lihat juga:
Buku catatan | Keterangan |
---|---|
boto | AWS SDK resmi untuk Python. |
s3cmd | Berinteraksi dengan S3 melalui baris perintah. |
s3distcp | Menggabungkan file yang lebih kecil dan menggabungkannya dengan mengambil pola dan file target. S3DistCp juga dapat digunakan untuk mentransfer data dalam jumlah besar dari S3 ke klaster Hadoop Anda. |
s3-paralel-put | Mengunggah banyak file ke S3 secara paralel. |
pergeseran merah | Bertindak sebagai gudang data cepat yang dibangun di atas teknologi pemrosesan paralel masif (MPP). |
kinesis | Mengalirkan data secara real time dengan kemampuan memproses ribuan aliran data per detik. |
lambda | Menjalankan kode sebagai respons terhadap peristiwa, secara otomatis mengelola sumber daya komputasi. |
Notebook IPython mendemonstrasikan berbagai baris perintah untuk Linux, Git, dll.
Buku catatan | Keterangan |
---|---|
linux | Sistem operasi komputer mirip Unix dan sebagian besar mendukung POSIX. Penggunaan disk, pemisahan file, grep, sed, curl, melihat proses yang berjalan, penyorotan sintaksis terminal, dan Vim. |
anakonda | Distribusi bahasa pemrograman Python untuk pemrosesan data skala besar, analisis prediktif, dan komputasi ilmiah, yang bertujuan untuk menyederhanakan manajemen dan penerapan paket. |
buku catatan ipython | Lingkungan komputasi interaktif berbasis web tempat Anda dapat menggabungkan eksekusi kode, teks, matematika, plot, dan media kaya ke dalam satu dokumen. |
git | Sistem kontrol revisi terdistribusi dengan penekanan pada kecepatan, integritas data, dan dukungan untuk alur kerja non-linier terdistribusi. |
rubi | Digunakan untuk berinteraksi dengan baris perintah AWS dan untuk Jekyll, kerangka kerja blog yang dapat dihosting di Halaman GitHub. |
jekyll | Generator situs statis yang sederhana, sadar blog, untuk situs pribadi, proyek, atau organisasi. Merender templat Markdown atau Tekstil dan Cair, dan menghasilkan situs web statis lengkap yang siap dilayani oleh Apache HTTP Server, Nginx, atau server web lainnya. |
burung pelikan | Alternatif berbasis Python untuk Jekyll. |
Django | Kerangka Web Python tingkat tinggi yang mendorong pengembangan cepat dan desain yang bersih dan pragmatis. Dapat berguna untuk berbagi laporan/analisis dan untuk blogging. Alternatif yang lebih ringan termasuk Piramida, Labu, Tornado, dan Botol. |
Notebook IPython mendemonstrasikan fungsi lain-lain.
Buku catatan | Keterangan |
---|---|
ekspresi reguler | Lembar contekan ekspresi reguler berguna dalam perselisihan data. |
algoritma | Algorithmia adalah pasar untuk algoritma. Notebook ini menampilkan 4 algoritma berbeda: Deteksi Wajah, Peringkasan Konten, Alokasi Dirichlet Laten, dan Pengenalan Karakter Optik. |
Anaconda adalah distribusi gratis bahasa pemrograman Python untuk pemrosesan data skala besar, analisis prediktif, dan komputasi ilmiah yang bertujuan untuk menyederhanakan manajemen dan penerapan paket.
Ikuti instruksi untuk menginstal Anaconda atau miniconda yang lebih ringan.
Untuk petunjuk rinci, skrip, dan alat untuk menyiapkan lingkungan pengembangan Anda untuk analisis data, lihat repo dev-setup.
Untuk melihat konten interaktif atau mengubah elemen dalam buku catatan IPython, Anda harus mengkloning atau mengunduh repositori terlebih dahulu, lalu menjalankan buku catatan tersebut. Informasi lebih lanjut tentang Notebook IPython dapat ditemukan di sini.
$ git clone https://github.com/donnemartin/data-science-ipython-notebooks.git
$ cd data-science-ipython-notebooks
$ jupyter notebook
Notebook diuji dengan Python 2.7.x.
Kontribusi dipersilakan! Untuk laporan bug atau permintaan, silakan kirimkan masalah.
Jangan ragu untuk menghubungi saya untuk mendiskusikan masalah, pertanyaan, atau komentar apa pun.
Repositori ini berisi beragam konten; beberapa dikembangkan oleh Donne Martin, dan beberapa dari pihak ketiga. Konten pihak ketiga didistribusikan di bawah lisensi yang diberikan oleh pihak-pihak tersebut.
Konten yang dikembangkan oleh Donne Martin didistribusikan di bawah lisensi berikut:
Saya memberikan kode dan sumber daya dalam repositori ini kepada Anda di bawah lisensi sumber terbuka. Karena ini adalah repositori pribadi saya, lisensi yang Anda terima atas kode dan sumber daya saya berasal dari saya dan bukan perusahaan saya (Facebook).
Copyright 2015 Donne Martin
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.