สร้างโดยถังหยูตี้
ความตั้งใจดั้งเดิมของการจัดโครงการนี้คือเพื่ออำนวยความสะดวกให้นักเรียนเริ่มต้นแผนการศึกษาด้วยตนเองด้านปัญญาประดิษฐ์ได้อย่างรวดเร็ว หลีกเลี่ยงการอ้อมในกระบวนการเรียนรู้ และเริ่มต้นใช้งาน AI โดยเร็วที่สุด และเริ่มโครงการ เชิงปฏิบัติได้เกือบ 200 กรณี และโครงการ ต่างๆ เหล่านี้ไม่ใช่ออนไลน์ สิ่งที่ฉันรวบรวมคือกรณีต่างๆ ที่พัฒนาและสะสมโดยฉันในช่วงห้าปีที่ผ่านมาของการสอนออนไลน์และออฟไลน์ เรียกได้ว่ามีการปรับปรุงซ้ำแล้วซ้ำอีกและเหมาะสำหรับผู้เรียนที่จะเรียนรู้และฝึกฝนทีละขั้นตอน นักเรียนที่มาที่นี่อย่าลืมคลิกดาวเพื่อบันทึก!
เมื่อปลายปี 2019 ฉันได้ตีพิมพ์หนังสือเรียนสนับสนุนหลักสูตรการเรียนรู้ของเครื่อง "เรียนรู้การวิเคราะห์ข้อมูล Python และแบบฝึกหัดการเรียนรู้ของเครื่องกับดิเอโก" ในที่สุดสไตล์นี้ก็ยังเข้าใจได้ง่าย . เพื่ออำนวยความสะดวกให้นักเรียนจำนวนมากขึ้นสามารถเริ่มแผนการเรียนได้อย่างรวดเร็ว ฉันจึงตัดสินใจ มอบหนังสือเล่มนี้ในรูปแบบอิเล็กทรอนิกส์ให้คุณฟรี ฉันหวังว่ามันจะสามารถนำประโยชน์การเรียนรู้มาสู่ทุกคน! คุณสามารถดาวน์โหลดเวอร์ชัน PDF ได้ที่หน้าแรกของโครงการนี้ หากคุณชอบสื่อการสอน คุณสามารถซื้อได้จาก JD.com
"เรียนรู้การวิเคราะห์ข้อมูล Python และแบบฝึกหัดการเรียนรู้ของเครื่องกับดิเอโก" ดาวน์โหลดต้นฉบับ PDF :
(ลิงก์ดิสก์เครือข่าย: https://pan.baidu.com/s/19wzJeyPmwTBDp9ASEWBvFQ รหัสการแยก: tece )
แค็ตตาล็อกต่อไปนี้เป็นเส้นทางการเรียนรู้ แนะนำให้ผู้เริ่มต้นศึกษาตามลำดับที่ระบุในแค็ตตาล็อก นักเรียนที่เริ่มเรียนแล้วสามารถเลือกได้ตามความต้องการ
ข้อมูลที่เกี่ยวข้องในกรณีนี้เป็นชุดข้อมูลจริงทั้งหมด และบางส่วนจะมีขนาดค่อนข้างใหญ่ การอัปโหลดโดยตรงไปยัง GitHub จะช้ามากสำหรับทุกคนในการดาวน์โหลด ฉันจะค่อยๆ อัปโหลดลิงก์ดิสก์เครือข่ายของแต่ละโมดูลซึ่งรวมถึงข้อมูลและโค้ด , PPT และแหล่งเรียนรู้อื่นๆ หากคุณต้องการคำอธิบายวิดีโอสนับสนุน โปรดเพิ่ม WeChat: digexiaozhushou (พินอินของผู้ช่วยตัวน้อยของ Di Ge)
หากคุณมีประเด็นด้านความร่วมมือ การสื่อสาร หรือโครงการในด้านต่างๆ คุณสามารถเพิ่ม WeChat ได้โดยตรง: digexiaozhushou (พินอินของ Dige Assistant)
หากต้องการเรียนรู้ปัญญาประดิษฐ์ (วิทยาศาสตร์ข้อมูล) คุณยังต้องมีทักษะพื้นฐานบางอย่าง ทักษะพื้นฐานและหลักที่สุดคือ Python และ คณิตศาสตร์ ! ไม่ใช่เรื่องยากสำหรับพี่น้องสองคนนี้ในการเริ่มต้น เป็นเรื่องปกติที่จะเชี่ยวชาญพื้นฐานก่อนและเรียนรู้ขณะใช้งาน!
หากคุณไม่คุ้นเคยกับ Python ฉันขอแนะนำให้คุณดูหลักสูตรวิดีโอ Python เบื้องต้นของฉันเพื่อเริ่มต้นอย่างรวดเร็ว! พอร์ทัล
อธิบายตรงที่สุดคือใครๆ ก็ใช้! เมื่อก่อนเคยเป็นการเขียนโปรแกรมเชิงวัตถุ แต่คนรุ่นหลังชอบการเขียนโปรแกรมแบบคัดลอกและวาง และตอนนี้พวกเขาขี้เกียจเกินไปที่จะเขียนโปรแกรมสำหรับ GitHub เป็นเรื่องจริง คุณต้องขี้เกียจเมื่อคุณควรขี้เกียจ และ Python ก็ทำสิ่งนี้ ! เนื้อหาเชิงปฏิบัติที่ตามมาทั้งหมดจะขึ้นอยู่กับ Python ดังนั้นคุณไม่มีทางเลือก!
อนาคอนด้า ก็พอ! อนาคอนด้าก็พอ! อนาคอนด้าก็พอ! โอเค ฉันพูดไปแล้วสามครั้ง สำหรับคำอธิบายโดยละเอียด โปรดดูที่หลักสูตรพอร์ทัลด้านบน
ชุดเครื่องมือหมายความว่าผู้อื่นได้เขียนฟังก์ชันทั้งหมดแล้ว และเราสามารถเรียกมันได้โดยตรงเท่านั้นเอง! มีชุดเครื่องมือที่เกี่ยวข้องสำหรับการประมวลผลข้อมูล การวิเคราะห์ การสร้างแบบจำลอง ฯลฯ สำหรับการเรียนรู้ ไม่จำเป็นต้องจำชุดเครื่องมือเหล่านี้ คุณต้องทำความคุ้นเคยกับชุดเครื่องมือเหล่านี้ก่อน และคุณจะต้องใช้และตรวจสอบในภายหลังอย่างแน่นอน
ชื่อชุดเครื่องมือ | ภาพรวมฟังก์ชั่น |
---|---|
นัมปี้ | สิ่งที่จำเป็นสำหรับการคำนวณเมทริกซ์! เป็นแกนหลักของการคำนวณที่ตามมาทั้งหมดและเป็นชุดเครื่องมือหลักในสาขาวิทยาศาสตร์ข้อมูล |
หมีแพนด้า | สิ่งที่จำเป็นสำหรับการประมวลผลข้อมูล! เขาจะต้องอ่านข้อมูล ประมวลผลข้อมูล และวิเคราะห์ข้อมูล! |
Matplotlib | การแสดงภาพเป็นสิ่งจำเป็น! ฟังก์ชั่นนี้ทรงพลังมาก ไม่มีภาพใด ๆ ที่ไม่สามารถวิเคราะห์และแสดงผลได้! |
ซีบอร์น | เครื่องมือสร้างภาพที่ง่ายกว่า! โค้ดหนึ่งบรรทัดช่วยให้คุณเห็นภาพผลลัพธ์ได้ |
นักเรียนจะต้องตระหนักดีว่าคณิตศาสตร์มีความสำคัญเพียงใด โดยเฉพาะอย่างยิ่งในสาขาปัญญาประดิษฐ์ (วิทยาศาสตร์ข้อมูล) เป็นเรื่องยากที่จะทำสิ่งใดโดยที่ไม่รู้คณิตศาสตร์ นักเรียนหลายคนถามคำถามกับฉันว่าคณิตศาสตร์มากมายสามารถนำมาใช้ในการทำงานได้จริงหรือไม่ ? ผมขออธิบายให้คุณฟังว่าอุตสาหกรรมปัญญาประดิษฐ์กำลังพัฒนาอย่างรวดเร็ว ในการทำงานจริง คุณต้องเรียนรู้ไปพร้อมกับการทำงานด้วย คงจะเป็นหนึ่งในบทความที่โดดเด่นในปัจจุบัน หากคุณไม่เข้าใจสูตรทางคณิตศาสตร์พื้นฐานด้วยซ้ำ ก็ไม่จำเป็นต้องพูดถึงเทคโนโลยีระดับสูงอีกต่อไป นักเรียนในสาขานี้จะต้องมีแนวคิดนี้แน่นอน สิ่งที่เรียกว่าปัญญาประดิษฐ์คือการคำนวณทางคณิตศาสตร์ต่างๆ กับข้อมูล!
ฉันไม่คิดว่าคุณจำเป็นต้องเริ่มต้นจากศูนย์และใช้เวลามากมายในการเรียนรู้ทีละขั้นตอน ตัวอย่างเช่น เพื่อนร่วมงานและเพื่อนของฉันทำสิ่งนี้มาเป็นเวลานานแล้ว ไม่รู้ว่ากี่ครั้งแล้ว ฉันเรียนคณิตศาสตร์มาหลายครั้งแล้ว แต่ฉันก็ต้องเผชิญกับปัญหานี้เช่นกัน สิ่งหนึ่งที่ฉันทำบ่อยที่สุดคือการค้นหาสิ่งที่ฉันใช้ จริงๆ แล้วกระบวนการค้นหาเป็นกระบวนการของการเรียนรู้และความก้าวหน้า ขอแนะนำให้คุณศึกษาประเด็นความรู้ทั่วไปอย่างรวดเร็ว (คณิตศาสตร์ขั้นสูง ความเป็นเส้นตรง พื้นฐานของทฤษฎีความน่าจะเป็น) ในระหว่างกระบวนการนี้ อย่าดูกระบวนการแก้ปัญหาต่างๆ และคุณไม่จำเป็นต้องกังวลเกี่ยวกับวิธีการแก้ปัญหาเฉพาะ พูดตรงๆ แค่เข้าใจว่าสูตรทำอะไรและใช้ทำอะไรก็เพียงพอแล้ว คล้ายๆ แบบฝึกหัดในตำราและเฉลยในสมุดแบบฝึกหัด ต่อไปก็ไม่ได้ใช้ ปากกาสำหรับคำนวณสิ่งที่ยุ่งยากเหล่านี้ ประหยัดเวลาในการศึกษาอัลกอริทึมที่คุ้มค่ากว่า!
จุดความรู้ | เนื้อหา | ผล |
---|---|---|
คณิตศาสตร์ขั้นสูง | พื้นฐานของคณิตศาสตร์ขั้นสูง แคลคูลัส สูตรของเทย์เลอร์ และลากรองจ์ | จำเป็นสำหรับการได้รับสูตรการเรียนรู้ของเครื่อง |
พีชคณิตเชิงเส้น | พื้นฐานของพีชคณิตเชิงเส้นค่าลักษณะเฉพาะและการสลายตัวของเมทริกซ์ | จำเป็นสำหรับการแก้ปัญหาอัลกอริทึม |
ทฤษฎีความน่าจะเป็น | พื้นฐานของทฤษฎีความน่าจะเป็น ตัวแปรสุ่ม และการประมาณค่าความน่าจะเป็น การแจกแจงที่ใช้โดยทั่วไป | แมชชีนเลิร์นนิงมักกล่าวถึงคำเหล่านี้ |
การวิเคราะห์ทางสถิติ | การวิเคราะห์การถดถอย การทดสอบสมมติฐาน การวิเคราะห์สหสัมพันธ์ การวิเคราะห์ความแปรปรวน | จำเป็นสำหรับการวิเคราะห์ข้อมูล |
แกนหลักของสาขาปัญญาประดิษฐ์คือการเรียนรู้ของเครื่อง ไม่ว่าคุณจะต้องการติดตามทิศทางใดในอนาคต คุณต้องเริ่มต้นด้วยการเรียนรู้ของเครื่อง! มีสองสิ่งสำคัญ สิ่งแรกคือการฝึกฝนหลักการของอัลกอริธึมแบบคลาสสิก และอย่างที่สองคือการมีความเชี่ยวชาญในการใช้ชุดเครื่องมือ Python สำหรับการสร้างแบบจำลองเชิงปฏิบัติ!
สิ่งที่ต้องเรียนรู้เกี่ยวกับอัลกอริธึม? ทำความเข้าใจว่าอัลกอริธึมการเรียนรู้ของเครื่องจักรทำงานกับข้อมูลอย่างไรเพื่อให้กระบวนการสร้างโมเดลและการแก้ปัญหาสมบูรณ์ หากพูดตรงๆ ก็คือ การทำความคุ้นเคยกับวิธีใช้คณิตศาสตร์ในอัลกอริธึม สิ่งสำคัญคือต้องเข้าใจ! อย่าจมอยู่กับปัญหาอย่างไม่มีที่สิ้นสุด เป็นการเสียเวลา และคุณอาจสามารถแก้ไขได้ในเวลาไม่นานในระหว่างกระบวนการเรียนรู้ที่ตามมา ฉันคิดว่าคุณต้องศึกษาอัลกอริธึมมากกว่าหนึ่งครั้ง โดยเฉพาะนักเรียนที่กำลังเตรียมตัวสัมภาษณ์งาน เป็นเรื่องปกติที่จะศึกษาอัลกอริธึม 2-3 ครั้ง (เพื่อนร่วมชั้นเคยบอกฉันว่าเขาเรียนหลักสูตรนี้ทั้งหมด 6 ครั้งก่อนการสัมภาษณ์) )
Machine Learning ยังจำเป็นต่อ Deep Learning หรือไม่?
การเรียนรู้เชิงลึกอาจกล่าวได้ว่าเป็นอัลกอริธึมการเรียนรู้ของเครื่องประเภทหนึ่ง ไม่ได้หมายความว่าไม่จำเป็นต้องใช้อัลกอริธึมแบบคลาสสิกอื่น ๆ กับโครงข่ายประสาทเทียม จะต้องเลือกอัลกอริธึมที่เหมาะสมที่สุดตามงานและข้อมูลที่แตกต่างกัน การเรียนรู้ของเครื่อง จริงๆ แล้ว มันง่ายมากที่จะดูโครงข่ายประสาทเทียมหลังจากเชี่ยวชาญอัลกอริธึมแบบคลาสสิกเหล่านี้แล้ว!
จุดความรู้ | เนื้อหา | ภาพรวม |
---|---|---|
อัลกอริธึมการจำแนกประเภท | การถดถอยโลจิสติก แผนผังการตัดสินใจ เครื่องเวกเตอร์สนับสนุน อัลกอริธึมทั้งมวล อัลกอริธึมแบบเบย์ | นักเรียนที่เตรียมตัวสัมภาษณ์จะต้องเชี่ยวชาญ |
อัลกอริธึมการถดถอย | การถดถอยเชิงเส้น แผนผังการตัดสินใจ อัลกอริธึมทั้งมวล | อัลกอริธึมบางตัวสามารถทำได้ทั้งการจำแนกประเภทและการถดถอย |
อัลกอริธึมการจัดกลุ่ม | เคมีน, dbscan ฯลฯ | ไม่ได้รับการดูแลจะพิจารณาเฉพาะเมื่อไม่มีป้ายกำกับจริงๆ เท่านั้น |
อัลกอริธึมการลดขนาด | การวิเคราะห์องค์ประกอบหลัก การวิเคราะห์จำแนกเชิงเส้น ฯลฯ | เน้นทำความเข้าใจแนวคิดเรื่องการลดมิติ |
อัลกอริธึมขั้นสูง | อัลกอริธึมการเพิ่ม GBDT, lightgbm, อัลกอริธึม EM, โมเดล Markov ที่ซ่อนอยู่ | นักเรียนที่มีเวลาและพลังงานสามารถท้าทายอัลกอริธึมขั้นสูงได้ |
วิเคราะห์ผลกระทบของวิธีการสร้างแบบจำลองอัลกอริทึมและพารามิเตอร์แบบคลาสสิกต่อผลลัพธ์ผ่านการทดสอบเปรียบเทียบ และทำความเข้าใจพารามิเตอร์และตัวอย่างการใช้งานในอัลกอริทึมผ่านการทดลองและการแสดงภาพ
ชื่อกรณี | ภาพรวมเนื้อหา |
---|---|
การวิเคราะห์เชิงทดลองการถดถอยเชิงเส้น | ศึกษาการถดถอยเชิงเส้นแบบตัวแปรเดียวและการถดถอยพหุคูณ วิธีการถดถอยแบบไม่เชิงเส้น และบทบาทของการปรับให้เป็นมาตรฐาน |
วิธีการประเมินแบบจำลอง | การเปรียบเทียบวิธีประเมินการจำแนกประเภทและวิธีประเมินอัลกอริทึมการถดถอยที่ใช้กันทั่วไป ตัวอย่างการแบ่งส่วนชุดข้อมูล |
การวิเคราะห์เชิงทดลองการถดถอยโลจิสติก | วิธีการก่อสร้างแบบจำลองการจำแนกประเภทคลาสสิก วิธีการวาดขอบเขตต้นไม้ตัดสินใจ |
การวิเคราะห์การทดลองอัลกอริทึมการจัดกลุ่ม | ตัวอย่างการสร้างแบบจำลองที่ไม่มีผู้ดูแล วิธีการประเมินอัลกอริธึมการจัดกลุ่ม บทบาทที่ไม่ได้รับการดูแลและตัวอย่างการใช้งาน |
การวิเคราะห์เชิงทดลองแผนผังการตัดสินใจ | ตัวอย่างการแสดงภาพแบบจำลองต้นไม้และวิธีการสร้าง การจำแนกประเภทและการประยุกต์การถดถอยของแบบจำลองต้นไม้ |
การวิเคราะห์เชิงทดลองอัลกอริทึมแบบผสมผสาน | ตัวอย่างการใช้งานและการวิเคราะห์ผลกระทบของวิธีการบูรณาการ การเปรียบเทียบกลยุทธ์การบูรณาการทั่วไป |
รองรับการวิเคราะห์เชิงทดลองของเครื่องเวกเตอร์ | SVM เกี่ยวข้องกับพารามิเตอร์และการทดลองเปรียบเทียบการสร้างแบบจำลอง |
การวิเคราะห์กฎสมาคมในทางปฏิบัติ | จุดความรู้ที่จำเป็นและตัวอย่างการวิเคราะห์แบบจำลองของกฎการเชื่อมโยง |
เพื่อให้เข้าใจกลไกของอัลกอริธึมได้ดีขึ้น เราจึงสร้างอัลกอริธึมแบบคลาสสิกตั้งแต่ต้น ยึดหลักการไม่สูญเสียแพ็กเก็ต และทำโมดูลทั้งหมดที่จำเป็นสำหรับอัลกอริธึมทีละขั้นตอน
วัตถุประสงค์หลักคือเพื่อให้เข้าใจหลักการทำงานของอัลกอริทึมได้ดีขึ้น และเน้นที่การฝึกฝน! นักเรียนที่มีเวลาสามารถทำซ้ำได้เอง แต่นักเรียนที่มีเวลาน้อยไม่จำเป็นต้องทำเอง
ชื่อกรณี | ภาพรวมเนื้อหา |
---|---|
การใช้โค้ดการถดถอยเชิงเส้น | ฟังก์ชันที่ใช้กันทั่วไปของอัลกอริธึมการสร้างโมดูล |
การใช้โค้ดการถดถอยโลจิสติก | ตัวอย่างการตีความวิธีการดำเนินการการถดถอยโลจิสติก |
การใช้โค้ด Kmeans | อัลกอริธึมแบบไม่มีผู้ดูแลที่ง่ายและเข้าใจง่าย |
การใช้โค้ดแผนผังการตัดสินใจ | จริงๆ แล้วโมเดลทรีเป็นการใช้งานแบบเรียกซ้ำ |
การใช้รหัสเครือข่ายประสาทเทียม | จำนวนโค้ดมีขนาดใหญ่เล็กน้อย ดังนั้นจึงแนะนำให้เรียนรู้โหมดแก้ไขข้อบกพร่อง |
การใช้โค้ดแบบเบย์ | Bayes ยังคงอธิบายได้ง่ายกว่าในงานข้อความ |
การใช้รหัสกฎการเชื่อมโยง | อัลกอริธึมการวิเคราะห์ข้อมูลที่ใช้กันทั่วไป |
สร้างระบบแนะนำเพลง | สร้างแบบจำลองระบบการแนะนำตั้งแต่เริ่มต้น |
ในการต่อสู้จริง คะแนนความรู้ทางคณิตศาสตร์อาจจะอ่อนลง เพราะส่วนใหญ่เราใช้ชุดเครื่องมือสำเร็จรูปเพื่อทำงานให้เสร็จสิ้น (คนขนย้ายแพ็คเกจ) มีฟังก์ชันประหยัดพลังงานมากมายที่ทุกคนต้องเชี่ยวชาญ ประการแรกคือการมีความชำนาญในการใช้ชุดเครื่องมือทั่วไปเหล่านี้ การประมวลผลข้อมูลล่วงหน้า วิศวกรรมคุณลักษณะ การปรับพารามิเตอร์ และการตรวจสอบ ล้วนเป็นขั้นตอนหลัก โดยสรุป กระบวนการและกิจวัตรที่จำเป็นในการทำงานที่แตกต่างกันให้เสร็จสิ้นจะคล้ายกัน แต่วิธีการและอัลกอริธึมที่ใช้อาจแตกต่างกัน ซึ่งทำให้ทุกคนต้องสะสมอย่างต่อเนื่องเพื่อเพิ่มประสบการณ์ในทางปฏิบัติ กรณีเหล่านี้ที่มอบให้กับนักเรียนสามารถใช้เป็นเทมเพลตที่ใช้งานได้จริงของตนเอง!
สิ่งที่สำคัญที่สุดคือการเรียนรู้วิธีประมวลผลล่วงหน้าและวิเคราะห์ข้อมูลต่างๆ (ค่าตัวเลข ข้อความ รูปภาพ) ใช้ฟังก์ชันหลักหลักในชุดเครื่องมืออย่างเชี่ยวชาญเพื่อเข้าร่วมในการประมวลผลล่วงหน้า เสนอโซลูชันที่หลากหลายสำหรับงานที่แตกต่างกัน และดำเนินการวิเคราะห์เชิงทดลอง สรุปคือทำการทดลองมากขึ้นและลงมือทำจริงมากขึ้น ยิ่งคุณเขียนโค้ดมากเท่าไร คุณก็จะยิ่งเชี่ยวชาญมากขึ้นเท่านั้น!
ชื่อกรณี | ภาพรวมเนื้อหา |
---|---|
K อัลกอริธึมเพื่อนบ้านที่ใกล้ที่สุดในทางปฏิบัติ | กรณีเบื้องต้นของแมชชีนเลิร์นนิง การเรียนรู้ชุดเครื่องมือที่ใช้กับวิธีการสร้างแบบจำลอง |
การตรวจจับความผิดปกติของข้อมูลธุรกรรม | การวิเคราะห์และการเปรียบเทียบรายละเอียดที่สำคัญมากในการประมวลผลข้อมูลและกลยุทธ์การสร้างแบบจำลอง |
แบบฝึกหัดการสร้างแบบจำลองอัลกอริธึมแบบผสมผสาน | ฉันไม่จำเป็นต้องพูดเพิ่มเติมเกี่ยวกับการบูรณาการ มันเป็นกลยุทธ์หลักที่ต้องมี |
การทำนายอุณหภูมิตามป่าสุ่ม | ฟอเรสต์สุ่มเป็นอัลกอริธึมที่ใช้บ่อยที่สุดในการเรียนรู้ของเครื่อง |
การฝึกปฏิบัติในการจำแนกข่าว | การวิเคราะห์และประมวลผลข้อมูลข้อความ และการสร้างแบบจำลองเชิงปฏิบัติโดยใช้อัลกอริทึมแบบเบย์ |
การวิเคราะห์การปฏิบัติการจัดกลุ่ม | ตัวอย่างการใช้งานที่ไม่ได้รับการดูแล |
การวิเคราะห์อนุกรมเวลา | วิธีการผลิตข้อมูลอนุกรมเวลา การสร้างแบบจำลองโดยใช้ข้อมูลลำดับ |
คำเตือนการเลิกใช้งานของผู้ใช้ | ฉันมักจะพูดว่าผู้ใช้ Fantasy Westward Journey แพ้ นี่เป็นเพียงการสาธิต |
ใช้ lightgbm สำหรับการทำนายสภาพการจราจรในโรงแรม | นักฆ่ารายใหญ่อีกคน แย่กว่า xgboost เสียอีก |
ชุดข้อมูลโครงการสำรวจสำมะโนประชากร-การพยากรณ์รายได้ | เทมเพลตหลัก การวิเคราะห์ข้อมูล การแสดงภาพ ฯลฯ ล้วนมีอยู่ครบถ้วนแล้ว |
การเพิ่มประสิทธิภาพแบบเบย์ในทางปฏิบัติ | ตัวอย่างการใช้ชุดเครื่องมือเพิ่มประสิทธิภาพแบบเบย์ที่ยากยิ่งขึ้น |
การเปรียบเทียบวิธีคุณลักษณะข้อความ | การเปรียบเทียบวิธีการแยกคุณลักษณะที่ใช้กันทั่วไปสำหรับข้อมูลข้อความ |
ทำชุดเครื่องมือของคุณเอง | ทำกระเป๋าของคุณเองเพื่อความสนุกสนาน |
ชื่อกรณี | ภาพรวมเนื้อหา |
---|---|
กฎการเชื่อมโยงเชิงปฏิบัติของ Python | การใช้ชุดเครื่องมือเพื่อสร้างกฎการเชื่อมโยงนั้นง่ายมาก |
การวิเคราะห์และการสร้างแบบจำลองชุดข้อมูล Airbnb | ตัวอย่างการวิเคราะห์ชุดข้อมูลราคาที่อยู่อาศัยและการสร้างแบบจำลอง |
ระบบแนะนำโรงแรมตามความคล้ายคลึงกัน | เพื่อสร้างระบบแนะนำเพื่อแนะนำโรงแรมให้ครบถ้วน |
การวิเคราะห์การถดถอยการขายผลิตภัณฑ์ | การคาดการณ์ยอดขายซึ่งเป็นงานประจำมากสามารถทำได้โดยใช้วิธีการประจำ |
การวิเคราะห์และการสร้างแบบจำลองการสำรวจชุดข้อมูล PUBG | ชุดข้อมูล PlayerUnknown's Battlegrounds มาดูกันว่าใครฆ่าคุณ |
วิธีการตีความแบบจำลองในทางปฏิบัติ | จะตีความโมเดลหลังการสร้างแบบจำลองได้อย่างไร ชุดเครื่องมือเหล่านี้สามารถช่วยคุณได้ |
ชุดเครื่องมือที่จำเป็นสำหรับการประมวลผลภาษาธรรมชาติในทางปฏิบัติ | การตีความชุดเครื่องมือ NLP ทั่วไปและตัวอย่างเชิงปฏิบัติ |
การคาดการณ์ความน่าจะเป็นในการชำระหนี้ของลูกค้าธนาคาร | ข้อมูลลูกค้าธนาคารเพื่อคาดการณ์ความเป็นไปได้ในการชำระคืน |
แบบฝึกหัดการวิเคราะห์คลัสเตอร์ฟีเจอร์รูปภาพ | จะจัดกลุ่มข้อมูลภาพได้อย่างไร? |
ชุดข้อมูลโครงการสำรวจสำมะโนประชากร-การพยากรณ์รายได้ | เทมเพลตหลัก การวิเคราะห์ข้อมูล การแสดงภาพ ฯลฯ ล้วนมีอยู่ครบถ้วนแล้ว |
ใครๆ ก็ได้ยินคำว่า Data Analysis กันทุกวัน แต่เราควรทำอย่างไรดี? ไม่มีอะไรมากไปกว่าการได้รับข้อมูลอันมีค่าจากข้อมูล และยังมีวิธีการและกิจวัตรมากมาย ทิศทางนี้ไม่ต้องการการสะสมทางทฤษฎีใดๆ เพียงแค่ใช้ข้อมูลแล้วลงมือทำ! การสะสมคดีคือกระบวนการเรียนรู้!
พูดง่ายๆ ก็คือ การทำเหมืองข้อมูลคือการประยุกต์ใช้อัลกอริธึมการเรียนรู้ของเครื่องกับข้อมูลจำนวนมหาศาลเพื่อให้ได้ผลลัพธ์ที่ต้องการ การมุ่งเน้นในการทำเหมืองข้อมูลไม่ใช่ทางเลือกของอัลกอริธึมการเรียนรู้ของเครื่อง แต่เป็นวิธีการประมวลผลข้อมูลเพื่อให้ได้ผลลัพธ์การทำนายที่ดีขึ้น ที่นี่ วิศวกรรมคุณลักษณะและการประมวลผลล่วงหน้าจะกลายเป็นโซลูชันหลัก
ชื่อกรณี | ภาพรวมเนื้อหา |
---|---|
การคาดการณ์การช่วยเหลือไททานิค | กรณีการแข่งขัน Classic kaggle ซึ่งเป็นโครงการเชิงปฏิบัติโครงการแรกสำหรับการขุดข้อมูลระดับเริ่มต้น |
การสร้างคุณลักษณะข้อมูล | วิศวกรรมคุณลักษณะเป็นแกนหลักของการขุดข้อมูล ตาม sklearn มีการอธิบายวิธีสร้างคุณสมบัติต่างๆ |
การฝึกปฏิบัติการถ่ายภาพบุคคลของผู้ใช้ | ทุกคนต้องเคยได้ยินเกี่ยวกับการถ่ายภาพบุคคลของผู้ใช้มาก่อน จะนำข้อมูลมาใช้เพื่อเติมเต็มภาพบุคคลได้อย่างไร |
ตัวอย่างกลยุทธ์บูรณาการ | ในการขุดข้อมูล มักจะเลือกกลยุทธ์การบูรณาการเพื่อปรับปรุงผลให้ดีขึ้น |
Xgboost การต่อสู้จริง | ตัวแทนทั่วไปในการบูรณาการและเป็นอาวุธนักฆ่าในการแข่งขัน |
การคาดการณ์ความตั้งใจซื้อของ JD.com | ปัญหาการทำนายแบบคลาสสิก ทำงานการทำนายให้เสร็จสมบูรณ์ตามข้อมูลพฤติกรรมในอดีตของผู้ใช้ |
แบบสำรวจวิทยาศาสตร์ข้อมูล kaggle | แสดงผู้เข้าร่วมการแข่งขัน kaggle ด้วยสายตา |
พยากรณ์ราคาบ้าน | กรณีระดับเริ่มต้นของการทำเหมืองข้อมูลเพื่อเชี่ยวชาญกิจวัตรได้อย่างรวดเร็ว |
การวิเคราะห์ผู้ใช้ที่ละเอียดอ่อนด้านพลังงาน | ตัวอย่างการแข่งขัน อธิบายบทบาทของวิศวกรรมคุณลักษณะเป็นหลัก |
การทำนายอนุกรมเวลาของ fbprophet | อัลกอริธึมที่ใช้งานได้จริงสำหรับการพยากรณ์อนุกรมเวลา ใช้งานง่ายมาก |
เราได้เลือกกรณีการแข่งขันขนาดใหญ่ เช่น Tianchi, Kaggle และ Rongji สำหรับทุกคน และรหัสและโซลูชันที่ให้ไว้เป็นแนวคิดในการแก้ปัญหาของผู้ชนะในระหว่างการแข่งขัน เช่นเดียวกับถ้าคุณต้องการเรียนรู้การเล่นหมากรุก คุณต้องเล่นกับผู้เล่นที่เก่งที่สุดเพื่อพัฒนาตัวเอง แต่ละกรณีจะอธิบายแนวคิดของผู้ชนะและวิธีแก้ปัญหาโดยรวม และจัดเตรียมการติดตั้งโค้ด มีประโยชน์มากสำหรับทุกคนในการปรับปรุง!
ชื่อกรณี | ภาพรวมเนื้อหา |
---|---|
การวิเคราะห์กิจกรรมผู้ใช้วิดีโอสั้นของ Kuaishou | คาดการณ์กิจกรรมถัดไปตามข้อมูลพฤติกรรมของผู้ใช้ |
พยากรณ์การผลิตสารเคมีอุตสาหกรรม | วิเคราะห์ข้อมูลและแบบจำลองอุตสาหกรรมเคมีเพื่อคาดการณ์ประสิทธิภาพการผลิต |
การทำนายเวลาเดินทางบนถนนในเมืองอย่างชาญฉลาด | การแข่งขันแบบติดดินที่คาดการณ์เวลาเดินทางโดยอิงจากข้อมูลถนน |
ชุดเครื่องมือตีความแบบจำลองทางวิศวกรรมที่มีคุณลักษณะ | ด้านที่ยากที่สุดประการหนึ่งของการขุดข้อมูลคือการตีความคุณลักษณะ ชุดเครื่องมือเหล่านี้มีประโยชน์มาก |
ข้อมูลโรคเบาหวานทางการแพทย์ชื่อการรับรู้เอนทิตี | คำอธิบายอัลกอริทึมการรู้จำเอนทิตีที่มีชื่อและการวิเคราะห์ตัวอย่างแอปพลิเคชัน |
วิศวกรรมแบบจำลองการควบคุมความเสี่ยงแพลตฟอร์มสินเชื่อ | การใช้แบบจำลองกราฟิกเพื่อสร้างวิศวกรรมคุณลักษณะเป็นแนวคิดที่ใช้กันอย่างแพร่หลาย |
รูปแบบการแยกคำหลักข่าว | การดึงคำหลักอาจกล่าวได้ว่าเป็นทักษะที่จำเป็นสำหรับ NLP |
เทมเพลตเชิงปฏิบัติสำหรับโปรเจ็กต์แมชชีนเลิร์นนิง | เทมเพลตอยู่ที่นี่ คุณสามารถนำไปใช้กับงานในอนาคตได้ วิธีการจะคล้ายกัน |
การวิเคราะห์ผู้ใช้ที่ละเอียดอ่อนด้านพลังงาน | ตัวอย่างการแข่งขัน อธิบายบทบาทของวิศวกรรมฟีเจอร์เป็นหลัก |
การทำเหมืองข้อมูลส่วนใหญ่ใช้การสร้างแบบจำลองในการคาดการณ์ ในขณะที่การวิเคราะห์ข้อมูลมุ่งเน้นไปที่การแสดงภาพและการวิเคราะห์ผลกระทบของตัวบ่งชี้ต่างๆ ที่มีต่อผลลัพธ์ เราได้เลือกกรณีการวิเคราะห์แบบคลาสสิกบางกรณีสำหรับคุณ ซึ่งหลายกรณีสามารถใช้เป็นเทมเพลตได้โดยตรง
ชื่อกรณี | ภาพรวมเนื้อหา |
---|---|
เทคนิคการวาดภาพพล็อตแบบกระจาย | ว่ากันว่าการแสดงภาพเป็นจุดสำคัญ และการวาดภาพก็เป็นสิ่งจำเป็นอย่างยิ่ง |
การวิเคราะห์และการสร้างแบบจำลองการดำเนินงานแท็กซี่นิวยอร์ก | หลังจากใช้ชุดเครื่องมือมากมาย คุณจะคุ้นเคยกับวิธีวิเคราะห์และแสดงข้อมูลทางภูมิศาสตร์ได้ |
งานแนะนำภาพยนตร์ตามการวิเคราะห์ทางสถิติ | วิธีที่ใช้กันทั่วไปสำหรับการวิเคราะห์ทางสถิติและคำแนะนำ |
เทมเพลตการวิเคราะห์ข้อมูลและการเรียนรู้ของเครื่อง | เทมเพลตนี้ครอบคลุมมาก รวมถึงการวิเคราะห์ การแสดงผล การสร้างโมเดล และการประเมินผล |
การลดขนาดข้อมูล | การวิเคราะห์เปรียบเทียบและการแสดงอัลกอริธึมการลดขนาดที่ใช้กันทั่วไปหลายอย่าง |
การแสดงภาพผลิตภัณฑ์และการประมวลผลข้อความ | การประมวลผลข้อมูลข้อความล่วงหน้าและการแสดงภาพ |
การวิเคราะห์หลายตัวแปร | การวิเคราะห์หลายตัวแปรยังเป็นวิธีการทั่วไปในการวิเคราะห์ข้อมูล |
การวิเคราะห์ชุดข้อมูลการสั่งซื้อผลิตภัณฑ์ | สั่งซื้อการวิเคราะห์ชุดข้อมูล |
การวิเคราะห์ข้อมูลสินเชื่อของ KIVA | การวิเคราะห์ชุดข้อมูลสินเชื่อ |
การเรียนรู้เชิงลึกอาจกล่าวได้ว่าเป็นอัลกอริธึมที่มีประโยชน์ที่สุดในขณะนี้ และสามารถนำมาใช้ในด้านต่างๆ ได้ ในความเป็นจริง แกนกลางยังอยู่ในการมองเห็นของคอมพิวเตอร์และการประมวลผลภาษาธรรมชาติ เนื่องจากอัลกอริธึมโครงข่ายประสาทเทียมเหมาะสำหรับข้อมูลรูปภาพและข้อความมากกว่า สิ่งสำคัญที่คุณต้องเชี่ยวชาญคืออัลกอริธึมและเฟรมเวิร์ก อัลกอริธึมคือโมเดลเครือข่ายแบบคลาสสิก เช่น CNN และ RNN และเฟรมเวิร์กเป็นเครื่องมือที่ใช้งานได้จริง เช่น tenorflow, Pytorch ฯลฯ ซึ่งจะกล่าวถึงรายละเอียดในภายหลัง
ดูเหมือนว่าเมื่อเพื่อนหลายคนได้รับงาน ความคิดแรกของพวกเขาคือการใช้การเรียนรู้เชิงลึกโดยตรง ถ้า Deep Learning ยากและยุ่งยาก มันจะยังเป็นที่นิยมอยู่ไหม? ที่จริงแล้ว ในทางตรงกันข้าม ฉันคิดว่าการเรียนรู้เชิงลึกนั้นง่ายกว่าการเรียนรู้ของเครื่องอย่างมาก ในการเรียนรู้ของเครื่อง เราจำเป็นต้องเลือกวิธีการประมวลผลล่วงหน้าที่แตกต่างกัน และนำเสนอวิธีการก่อสร้างทางวิศวกรรมสำหรับข้อมูลที่แตกต่างกัน กิจวัตรในการเรียนรู้เชิงลึกนั้นค่อนข้างคงที่มากกว่า และด้วยเฟรมเวิร์กโอเพ่นซอร์สและสถาปัตยกรรมเครือข่ายหลักแบบคลาสสิกเหล่านี้ สิ่งที่เราต้องทำก็แค่ปรับใช้มัน ความยากโดยรวมนั้นง่ายกว่างานแมชชีนเลิร์นนิง (พูดได้เลย!)
ชื่ออัลกอริทึม | ภาพรวมเนื้อหา |
---|---|
โครงข่ายประสาทเทียม | โครงข่ายประสาทเทียมเป็นเครือข่ายพื้นฐานที่สุด ซึ่งเทียบเท่ากับการวางรากฐานสำหรับการเรียนรู้เครือข่ายที่ตามมา |
โครงข่ายประสาทเทียมแบบหมุนวน | ฟังดูคุ้นๆ สำหรับทุกคน เป็นพี่ใหญ่แห่งการเรียนรู้เชิงลึก! เครือข่ายหลักของคอมพิวเตอร์วิทัศน์ |
โครงข่ายประสาทเทียมที่เกิดซ้ำ | Bei Qiao Feng และ Nan Murong เป็นพี่ใหญ่ในการประมวลผลภาษาธรรมชาติ! |
เครือข่ายกำเนิดฝ่ายตรงข้าม | เป็นรุ่นที่ได้รับความนิยมในขณะนี้ เล่นสนุก และสามารถนำไปใช้ในการฟิวชั่นภาพต่างๆ ได้ |
แบบจำลองเครือข่ายลำดับ | สถาปัตยกรรมที่ใช้กันทั่วไปใน NLP ซึ่งเป็นโมเดลการแปลการเรียนรู้ของเครื่อง มีจุดใช้งานมากมาย |
สถาปัตยกรรมเครือข่ายแบบคลาสสิกที่สำคัญ | CNN และ RNN ที่กล่าวถึงในตอนนี้เป็นโมเดลเครือข่ายที่ค่อนข้างพื้นฐาน และมีส่วนขยายมากมายที่ทุกคนจำเป็นต้องเชี่ยวชาญ |
กรอบงานเปรียบเสมือนการบอกว่าคุณออกแบบโมเดลเครือข่าย แต่การดำเนินกระบวนการคำนวณเฉพาะทั้งหมดด้วยตัวเองคงเป็นเรื่องยากเกินไป กรอบการทำงานนี้มีวิธีการคำนวณที่มีประสิทธิภาพและไม่จำเป็นต้องให้เราดำเนินการให้เสร็จสิ้น ซึ่งเป็นชุดการคำนวณอัตโนมัติเต็มรูปแบบ เทียบเท่ากับที่เราเพียงแค่ต้องออกแบบโครงสร้างและปล่อยให้มีการก่อสร้างเฉพาะลงไปเท่านั้น สิ่งที่จำเป็นในการเล่น Deep Learning คือ Framework
Tensorflow, Pytorch, keras, caffe ฯลฯ มีเฟรมเวิร์กมากมาย ฉันควรเลือกอันไหน มีความแตกต่างใหญ่ระหว่างกรอบงานที่แตกต่างกันหรือไม่? กระแสหลักที่สุดในขณะนี้คือ tensorflow และ PyTorch ซึ่งเทียบเท่ากับ KFC และ McDonald's ทั้งสองมีความแข็งแกร่งมาก สำหรับการเลือกแบบใด โปรดดูที่ทีมงานโครงการและข้อกำหนดงานของคุณ หากฉันต้องแนะนำสิ่งใดสิ่งหนึ่ง ฉันจะแนะนำ PyTorch ให้กับทุกคน เพราะมันกระชับและเป็นที่นิยมมากกว่า ฉันใช้เฟรมเวิร์กเหล่านี้ทั้งหมดแล้ว เหตุผลหลักคือ ฉันมักจะต้องอ้างอิงถึงเอกสารและโครงการโอเพ่นซอร์สในงานของฉัน ฉันมักจะติดตามเฟรมเวิร์กที่ใช้สำหรับซอร์สโค้ดในเอกสารของผู้อื่นเพื่อการพัฒนารอง ดังนั้นทุกคน จะใช้กรอบงานเหล่านี้ไม่ช้าก็เร็ว!
ไม่มีทฤษฎีที่จะพูดถึงกรอบงาน และไม่จำเป็นต้องอ่านคำอธิบายยาวๆ ทุกรูปแบบ แค่ใช้มัน! ในความเป็นจริงมันเป็นชุดเครื่องมือที่คุณสามารถเรียนรู้ได้ในขณะที่ใช้งานและสามารถใช้เป็นเทมเพลตในการสรุปได้!
ชื่อเฟรม | ภาพรวมเนื้อหา |
---|---|
กรอบกาแฟ | กรอบการทำงานระดับเทพในสมัยโบราณได้ตกสู่ความอับอายแล้ว มันเป็นกรอบการทำงานแรกที่ฉันได้เรียนรู้ |
เวอร์ชัน Tensorflow2 | เวอร์ชัน 2 มีการปรับปรุงหลายอย่างและในที่สุดก็ใช้งานง่ายกว่าเวอร์ชัน 1 มาก |
เคราส | บอกได้คำเดียวว่าง่าย! เรียบง่าย! เรียบง่าย! ไม่จำเป็นต้องเรียนรู้ ดูโค้ดก็เข้าใจง่ายมาก |
ไพทอร์ช | Framework ที่ได้รับความนิยมมากที่สุดในขั้นตอนนี้ ฉันคาดว่ามันจะเป็น Framework ที่ได้รับความนิยมมากที่สุดในปีนี้ (2020) ด้วย แนะนำเลย! |
เรามอบกรณีการใช้งานจริงมากมายให้กับคุณสำหรับกรอบการเรียนรู้เชิงลึกที่สำคัญแต่ละอันที่คุณใช้ขึ้นอยู่กับความชอบของคุณ!
ฉันไม่จำเป็นต้องอธิบายว่า Google เป็นผู้จัดทำ โครงการโอเพ่นซอร์สจำนวนมากจึงใช้กรอบงาน TF อย่างแน่นอน หากคุณต้องการศึกษาหรืออ้างอิงถึงโครงการและเอกสารโอเพ่นซอร์สของผู้อื่น คุณต้องเรียนรู้ TF นอกจากนี้ยังใช้กันอย่างแพร่หลายในอุตสาหกรรม คลื่นลูกนี้ตอบโจทย์แน่นอน!
ชื่อกรณี | ภาพรวมเนื้อหา |
---|---|
การติดตั้งและการแนะนำเทนเซอร์โฟลว์ | มีการแนะนำเวอร์ชัน 2 ในวิธีการติดตั้ง เพียงอ่านคร่าวๆ |
การตีความหลักการโครงข่ายประสาทเทียมและสถาปัตยกรรมโดยรวม | ตรวจสอบสถาปัตยกรรมเครือข่ายประสาทเทียม |
สร้างโครงข่ายประสาทเทียมสำหรับงานจำแนกประเภทและการถดถอย | ใช้ TF เพื่อทำงานการจำแนกประเภทและการถดถอยขั้นพื้นฐานให้เสร็จสิ้น และเชี่ยวชาญวิธีการประยุกต์ |
หลักการโครงข่ายประสาทเทียมแบบม้วนและการตีความพารามิเตอร์ | สถาปัตยกรรมของ CNN ได้รับการอธิบายโดยละเอียดสำหรับแต่ละพารามิเตอร์ |
การฝึกระบุตัวตนของแมวและสุนัข | งานจำแนกภาพแบบคลาสสิกมีเรื่องให้พูดถึงมากมายซึ่งสำคัญมาก |
ตัวอย่างการปรับปรุงข้อมูลรูปภาพ | เรียกได้ว่าตอนนี้การปรับปรุงข้อมูลเป็นทักษะที่ต้องมี |
การฝึกอบรมการถ่ายทอดกลยุทธ์การเรียนรู้ในทางปฏิบัติ | ผลที่ได้จากการเรียนรู้แบบถ่ายโอนยังค่อนข้างดี |
การตีความหลักการของโครงข่ายประสาทเทียมแบบเรียกซ้ำและเวกเตอร์คำ | การตีความโมเดล RNN |
การใช้ word2vec ตาม TensorFlow | การตีความโมเดลเวกเตอร์คำและการนำไปใช้ตาม TF |
งานการจัดหมวดหมู่ข้อความตามโมเดล RNN | ทำงานจำแนกข้อความให้เสร็จสมบูรณ์ตาม TF |
tfrecord สร้างแหล่งข้อมูล | ตัวอย่างการผลิตแหล่งข้อมูล |
ใช้เครือข่าย CNN ในการฝึกจำแนกข้อความ | CNN ยังสามารถจัดหมวดหมู่ข้อความได้ |
การพยากรณ์อนุกรมเวลา | ตัวอย่างการประมวลผลข้อมูลอนุกรมเวลาและการสร้างแบบจำลอง |
เครือข่ายการสร้างฝ่ายตรงข้ามในทางปฏิบัติ | GAN มาแล้ว เรื่องนี้สนุกมาก |
การผสมผสานภาพที่ใช้งานได้จริงตามโครงการโอเพ่นซอร์ส CycleGan | GAN ที่ฉันชอบเล่น เอฟเฟกต์ค่อนข้างน่าขบขัน! |
สถาปัตยกรรมเครือข่ายแบบคลาสสิก Resnet ในทางปฏิบัติ | คุณสามารถเรียนรู้สถาปัตยกรรมเครือข่ายที่คุณต้องเข้าใจ! |
ณ สิ้นปี 2019 จำนวนผู้ใช้เฟรมเวิร์ก Pytorch แซงหน้าเทนเซอร์โฟลว์จนกลายเป็นเฟรมเวิร์กที่ได้รับความนิยมมากที่สุดในขณะนี้ จริงๆ แล้วทุกคนชอบใช้เฟรมเวิร์กที่เรียบง่ายและเข้าใจง่ายกว่า ความรู้สึกโดยรวมนั้นใช้งานง่ายกว่าเทนเซอร์โฟลว์และสะดวกในการดีบั๊ก ขอแนะนำให้ผู้เริ่มต้นให้ความสำคัญกับเฟรมเวิร์ก Pytorch
ชื่อกรณี | ภาพรวมเนื้อหา |
---|---|
การดำเนินการประมวลผลพื้นฐานของกรอบงาน PyTorch | เพียงทำความคุ้นเคยกับ PyTorch แล้วเริ่มต้นได้อย่างง่ายดาย |
การจำแนกประเภทเชิงปฏิบัติของโครงข่ายประสาทเทียมและงานการถดถอย | การใช้ PyTorch เพื่อสร้างโมเดลโครงข่ายประสาทเทียมนั้นใช้งานง่ายกว่า TF อย่างแน่นอน |
หลักการโครงข่ายประสาทเทียมแบบม้วนและการตีความพารามิเตอร์ | สถาปัตยกรรมแบบจำลองของ CNN และการตีความหนังสือพารามิเตอร์ |
การตีความเชิงปฏิบัติของโมดูลหลักในการจดจำภาพ | สิ่งที่สำคัญมากคือโมดูลหลักในการประมวลผลภาพใน PyTorch |
ตัวอย่างบทบาทและการประยุกต์ใช้การเรียนรู้แบบถ่ายทอด | กำลังโหลดโมเดลใน PyTorch เพื่อถ่ายโอนการเรียนรู้ |
การตีความหลักการของโครงข่ายประสาทเทียมแบบเรียกซ้ำและเวกเตอร์คำ | การตีความสถาปัตยกรรมแบบจำลอง RNN |
ฝึกปฏิบัติการจัดประเภทข้อความของชุดข้อมูลข่าว | สร้างโมเดลการจัดหมวดหมู่ข้อความตาม PyTorch |
หลักการและการวิเคราะห์เชิงปฏิบัติของสถาปัตยกรรมเครือข่ายกำเนิดฝ่ายตรงข้าม | การตีความแบบจำลอง GAN ยอดนิยม |
การผสมผสานภาพที่ใช้งานได้จริงตามโครงการโอเพ่นซอร์ส CycleGan | CYCLEGAN เวอร์ชัน PyTorch โครงการโอเพ่นซอร์สนี้เขียนได้ดีมาก |
หลักการรู้จำข้อความ OCR | จริงๆ แล้วหลักการของ OCR นั้นง่ายมาก และต้องได้รับความช่วยเหลือจากหลายโมเดลจึงจะเสร็จสมบูรณ์ |
แบบฝึกหัดโครงการการรู้จำข้อความ OCR | สร้างโมเดลเครือข่าย OCR |
การวิเคราะห์วิดีโอและการจดจำการกระทำตามการบิดแบบ 3 มิติ | ใช้ 3D Convolution เพื่อประมวลผลข้อมูลวิดีโอและจดจำพฤติกรรมให้สมบูรณ์ |
โมเดล BERT ที่ใช้งานได้จริงโดยใช้ PyTorch | สถาปัตยกรรมของ BERT ได้รับความนิยมมากจนเป็นหนึ่งในโมเดลที่ต้องมี |
การตีความเทมเพลตที่ใช้งานได้จริงของกรอบงาน PyTorch | จัดเตรียมเทมเพลตเพื่อให้สามารถปรับปรุงงานในอนาคตตามเทมเพลตได้ |
ความรู้สึกโดยรวมคือคุณไม่จำเป็นต้องเรียนรู้อะไรเลย คุณสามารถใช้มันได้โดยตรงจากเคส จริงๆ แล้วเวอร์ชัน TF2 นั้นคล้ายกับ keras มาก เหมาะสำหรับทำการทดลองและเขียนรายงาน ง่าย และรวดเร็ว!
ชื่อเคส | ภาพรวมเนื้อหา |
---|---|
การติดตั้งและแนะนำ | Keras ติดตั้งและเริ่มต้นใช้งานได้ง่ายขึ้นอยู่กับ TF |
สร้างโมเดลเครือข่ายประสาท | สร้างโมเดลเครือข่ายประสาทเพื่อทดสอบน่านน้ำ |
การต่อสู้อีกครั้งกับเครือข่ายประสาท Convolutional | รุ่น CNN นั้นง่ายต่อการสร้าง |
งานพยากรณ์อนุกรมเวลา LSTM | รุ่น LSTM ใช้กับงานอนุกรมเวลา |
การจำแนกประเภทข้อความ | ตัวอย่างการจำแนกข้อความ |
ฉลากหลายรายการและเอาต์พุตหลายรายการ | งานหลายฉลากเป็นเรื่องธรรมดามากและมีค่าการเรียนรู้ที่ดี |
การปฏิบัติจริงเกี่ยวกับการจำแนกข้อความของชุดข้อมูลข่าว | งานการจำแนกประเภทข้อความตาม keras |
การเพิ่มข้อมูล | การตีความตัวอย่างการเพิ่มข้อมูล |
เครือข่ายการกำเนิดของฝ่ายตรงข้าม | สถาปัตยกรรม gan มันง่ายกว่าที่จะใช้ keras |
ถ่ายโอนเครือข่ายการเรียนรู้และ resnet ที่เหลืออยู่ | คุณต้องเล่นกับโมเดล resnet ด้วยตัวเอง |
ที่อยู่ postcode งานหลายลำดับ | ตัวอย่างตัวอย่างข้อความ |
การปฏิบัติเครือข่าย SEQ2SEQ | โมเดลเครือข่ายลำดับยังคงใช้กันอย่างแพร่หลาย |
บทสรุปของเทมเพลตที่ใช้งานได้จริง | เทมเพลต Keras มีไว้สำหรับทุกคน |
ฉันคิดว่า Tensorflow และ Pytorch มีอยู่แล้วในขั้นตอนนี้และมันก็ไม่ใช่ตาของคาเฟอีนที่จะปรากฏขึ้นในขณะนี้ อาจมีเอกสารและงานบางอย่างที่ยังต้องใช้กรอบคาเฟอีน
ชื่อเคส | ภาพรวมเนื้อหา |
---|---|
การตีความไฟล์การกำหนดค่าคาเฟอีน | การตีความไฟล์การกำหนดค่าที่ใช้กันทั่วไปของเฟรมเวิร์กคาเฟอีน |
วิธีการก่อสร้างชุดข้อมูลต่างๆ | วิธีการก่อสร้างชุดข้อมูลสิ่งนี้สำคัญมาก |
การตีความเครื่องมือคาเฟอีนทั่วไป | มีเครื่องมือขนาดเล็กมากมายที่สร้างขึ้นเพื่อให้งานเสร็จสมบูรณ์อย่างรวดเร็ว |
การตรวจจับใบหน้าในทางปฏิบัติ | สร้างแบบจำลองการตรวจจับใบหน้าตามกรอบคาเฟอีน |
การปฏิบัติในทางปฏิบัติของการหาจุดสำคัญใบหน้า | แบบจำลองการจดจำจุดคีย์ใบหน้าที่สมบูรณ์ตามกรอบการทำงานของคาเฟอีน |
ฉันไม่จำเป็นต้องพูดอะไรมากมายเกี่ยวกับอุตสาหกรรมการมองเห็นคอมพิวเตอร์มันเป็นที่นิยมมากที่สุดในตอนนี้ แล้วคุณต้องเรียนรู้อะไรบ้าง? แกนกลางคือสองส่วนส่วนหนึ่งคือการประมวลผลภาพและอีกส่วนหนึ่งคือการสร้างแบบจำลองภาพ การประมวลผลภาพที่เรียกว่าเป็นสิ่งที่ OpenCV ทำ การสร้างแบบจำลองภาพส่วนใหญ่ใช้การเรียนรู้อย่างลึกซึ้งเพื่อทำงานให้เสร็จเช่นการตรวจจับและการรับรู้ ในขั้นตอนการศึกษานี้ฉันคิดว่าคุณไม่จำเป็นต้องอ่านเกี่ยวกับอัลกอริทึมการประมวลผลภาพแบบดั้งเดิม
ขอแนะนำให้คุณเลือกรุ่น Python เพื่อเรียนรู้และใช้งาน หากคุณพบสิ่งที่คุณไม่คุ้นเคยให้ตรวจสอบ API เพิ่มเติม โดยทั่วไปฟังก์ชั่นทั้งหมดใน OpenCV เกี่ยวข้องกับสูตรทางคณิตศาสตร์จำนวนมาก
เราได้เตรียมแหล่งข้อมูลและกรณีการเรียนรู้มากมายสำหรับทุกคน
ชื่อเคส | ภาพรวมเนื้อหา |
---|---|
บทนำ OpenCV และการกำหนดค่าสภาพแวดล้อม | การติดตั้งและการกำหนดค่าสภาพแวดล้อม |
การดำเนินการภาพพื้นฐาน | ใช้ OpENCV เพื่อดำเนินการประมวลผลภาพพื้นฐานและการปฏิบัติ! |
การกำหนดเกณฑ์และการปรับให้เรียบ | การดำเนินการประมวลผลที่ใช้กันมากที่สุดสามารถทำได้ด้วยรหัสเพียงไม่กี่บรรทัด |
การดำเนินการทางสัณฐานวิทยาของภาพ | เพิ่งคุ้นเคยกับการดำเนินการทางสัณฐานวิทยาเหล่านี้ |
การคำนวณการไล่ระดับสี | ตัวอย่างการคำนวณการไล่ระดับสี |
การตรวจจับขอบ | การตรวจจับขอบมีแอพพลิเคชั่นที่หลากหลาย |
ภาพพีระมิดและการตรวจจับรูปร่าง | ตัวอย่างการตรวจจับรูปร่างเอฟเฟกต์ยังคงดี |
การแปลงฮิสโตแกรมและฟูริเยร์ | เพิ่งทำความคุ้นเคยกับมัน |
บัตรประจำตัวบัตรการปฏิบัติงานโครงการดิจิตอลเครดิต | ทำโครงการปฏิบัติเพื่อตรวจจับและระบุหมายเลขบัตรเครดิต |
การสแกนเอกสารการปฏิบัติของโครงการ OCR | สแกนข้อมูลเอกสารสำหรับการรับรู้ OCR |
ภาพคุณสมบัติแฮร์ริส | วิธีการสกัดคุณสมบัติที่ใช้กันทั่วไปอัลกอริทึมนั้นง่ายและคุ้นเคย |
รูปภาพคุณสมบัติการเลือก | วิธีการสกัดคุณลักษณะที่เก่าแก่ที่สุดยังต้องใช้คณิตศาสตร์จำนวนมาก |
การเย็บภาพการฝึกซ้อม-พานามิก | ทุกคนต้องเล่นด้วยกล้องพาโนรามาจะทำอย่างไร? |
การระบุพื้นที่การปฏิบัติงานของโครงการที่จอดรถ | โครงการที่ใช้งานหนักสร้างรูปแบบการจดจำพื้นที่จอดรถตั้งแต่เริ่มต้น |
การระบุและการตัดสินบัตรคำตอบของโครงการและการตัดสิน | ขอให้สนุกกับการทำเครื่องหมายอัตโนมัติ |
การสร้างแบบจำลองพื้นหลัง | วิธีการรักษาทั่วไป |
การประมาณค่าการไหลของแสง | แค่คุ้นเคยกับมัน |
โมดูล OpenCV DNN | โหลดโมเดลที่ผ่านการฝึกอบรมเพื่อรับรู้ |
การปฏิบัติโครงการ - การติดตามเป้าหมาย | เอฟเฟกต์การติดตามค่อนข้างน่าสนใจ |
หลักการและการดำเนินงานของ Convolution | ไม่ว่าจะไปที่ไหนก็ตามมันเป็นแกนกลาง |
การตรวจจับการฝึกฝนการปฏิบัติงานโครงการ | การตรวจจับความเหนื่อยล้าจากกล้อง |
ฉันขอแนะนำให้นักเรียนที่กำลังเตรียมการสัมภาษณ์งานอ่านทั้งหมด รหัสภายในจำนวนเงินจะค่อนข้างใหญ่ดังนั้นจึงขอแนะนำให้เริ่มต้นด้วยโหมดการดีบักและดูที่รหัสทีละบรรทัด
เราขอแนะนำโครงการ MASK-RCNN สถานการณ์แอปพลิเคชันนั้นกว้างมากและเหมาะสำหรับการพัฒนาและการปรับปรุงที่สอง ฉันจะมุ่งเน้นไปที่การอธิบายโครงการและนำไปใช้กับตัวเอง
ชื่อโครงการ | ภาพรวมเนื้อหา |
---|---|
การถ่ายโอนสไตล์ภาพ (การถ่ายโอนสไตล์) | ส่วนใหญ่เพื่อเรียนรู้ความคิดของเขาผลกระทบยังคงน่าสนใจมาก |
สร้างภาพที่หายไปโดยอัตโนมัติโดยอัตโนมัติ | มีสถานการณ์แอปพลิเคชันมากมายสำหรับเครือข่าย GAN และสามารถซ่อมแซมรูปภาพได้ด้วยตนเอง |
การสร้างความละเอียดสูง | หนึ่งในประเด็นสำคัญของการวิจัยในช่วงไม่กี่ปีที่ผ่านมาผลลัพธ์ของบทความนี้ดีมากอยู่แล้ว |
โครงการตรวจจับวัตถุ | นี่คือโครงการโอเพ่นซอร์สที่ฉันเน้นสิ่งที่ต้องดู! ต้องดู! ต้องดู! |
คำอธิบายโดยละเอียดเกี่ยวกับซอร์สโค้ดเครือข่าย MaskRcnn | ซอร์สโค้ดมีความสำคัญมากคุณต้องเข้าใจทุกบรรทัด! |
ฝึกอบรมข้อมูลของคุณเองตามกรอบ MASK-RCNN | จะติดฉลากข้อมูลภาพและฝึกอบรมได้อย่างไร? นี่คือคำตอบของคุณ |
การสาธิตการรับรู้ท่าทางมนุษย์ | มีสถานการณ์แอปพลิเคชันมากมายสำหรับ maskrcnn |
การตรวจจับวัตถุ Fasterrcnn Series | งานคลาสสิกเกี่ยวกับการตรวจจับวัตถุที่สามารถใช้เป็นทรัพยากรการเรียนรู้ |
ฟิวชั่นภาพที่ใช้งานได้จริงตามโครงการโอเพนซอร์ส Cyclegan | Pytorch เวอร์ชันของ Cyclegan โครงการโอเพ่นซอร์สนี้เขียนได้ดีมาก |
หลักการจดจำข้อความ OCR | หลักการของ OCR นั้นง่ายมากและต้องการความช่วยเหลือจากหลายรุ่นในการทำให้เสร็จสมบูรณ์ |
การปฏิบัติโครงการจดจำข้อความ OCR | สร้างโมเดลเครือข่าย OCR |
การวิเคราะห์วิดีโอและการจดจำการกระทำบนพื้นฐานของ 3D convolution | ใช้ 3D convolution เพื่อประมวลผลข้อมูลวิดีโอและการจดจำพฤติกรรมที่สมบูรณ์ |
อาจกล่าวได้ว่าความยากลำบากค่อนข้างสูง แต่ข้อมูลข้อความยังไม่ได้รับการแก้ไขและบางครั้งมันก็ไม่ใช่เรื่องง่ายสำหรับมนุษย์ที่จะเข้าใจคอมพิวเตอร์เพียงอย่างเดียว ความท้าทายสูงยังเป็นประโยชน์สูง
ในปี 2018 Google Paper ออกมาเบิร์ต! มันเทียบเท่ากับกรอบการแก้ปัญหาทั่วไปสำหรับการประมวลผลภาษาธรรมชาติและสามารถทำงานทั้งหมดได้! สิ่งนี้ต้องการให้ทุกคนมุ่งเน้นไปที่การเรียนรู้และสามารถเขียนเป็นโครงการในประวัติย่อของคุณได้
ชื่อโครงการ | ภาพรวมเนื้อหา |
---|---|
รูปแบบภาษา | รูปแบบภาษาต้องการให้ทุกคนคุ้นเคยกับพื้นฐานของเวกเตอร์คำต่อมา |
ใช้ Gemsim เพื่อสร้างคำว่าเวกเตอร์ | Gensim เป็นแพ็คเกจที่มีประโยชน์จริงๆ! |
งานการจำแนกตาม Word2vec | ก่อนอื่นให้ใช้ตัวอย่างนี้เพื่อทำความเข้าใจวิธีการใช้เวคเตอร์คำ |
การเปรียบเทียบวิธีการคุณลักษณะข้อความ NLP | มีหลายวิธีในการสร้างคุณสมบัติข้อความอันไหนดีกว่ากัน? |
การวิเคราะห์ความเชื่อมั่นของ LSTM | ใช้โครงการนี้เพื่อทำความเข้าใจว่าอินพุตที่ต้องการโดยโมเดล RNN นั้นเป็นอย่างไร |
โมเดล NLP-Similarity | วิธีการคำนวณความคล้ายคลึงกันของข้อความ |
บอทสนทนา | สร้าง chatbot ตามเฟรมเวิร์ก Tensorlfow |
สร้างวิธีการป้อนข้อมูลของคุณเอง | คุณสามารถสร้างวิธีการป้อนข้อมูลของคุณเองได้หรือไม่? ช่วยให้คุณทำมันเสร็จ! |
หุ่นยนต์เขียนบทกวี Tang | ลองดูบทกวี Tang ที่เขียนโดยโมเดล! |
กล่องแปลภาษา NMT | โครงการโอเพ่นซอร์สมีความสามารถในการพัฒนาทุติยภูมิ |
ที่อยู่ postcode งานหลายลำดับ | งานการจำแนกประเภทข้อความคลาสสิก |
หลักการของเบิร์ตกรอบทั่วไปสำหรับการประมวลผลภาษาธรรมชาติ | นี่คือเบิร์ตที่กล่าวถึงข้างต้นจุด! จุด! จุด! |
การตีความซอร์สโค้ดของ Bert โครงการโอเพ่นซอร์สของ Google | ซอร์สโค้ดมีความสำคัญมากทุกบรรทัดจะต้องเข้าใจ |
การวิเคราะห์ความเชื่อมั่นของจีนขึ้นอยู่กับเบิร์ต | การพัฒนาแบบจำลองตามโครงการโอเพ่นซอร์ส |
การรับรู้เอนทิตีชื่อจีนขึ้นอยู่กับเบิร์ต | การรับรู้เอนทิตีที่ได้รับการตั้งชื่อตามโครงการโอเพ่นซอร์ส |
ผ่านหลักสูตรออนไลน์และการฝึกอบรมองค์กรออฟไลน์ในช่วงไม่กี่ปีที่ผ่านมาฉันได้พบกับเพื่อนมากมาย ทุกคนรู้จักฉันผ่านหลักสูตรวิดีโอและฉันมีความสุขมากที่ได้นำผลประโยชน์มาให้ทุกคน ขอบคุณเพื่อนมากมายที่ให้การสนับสนุนมาเลยคุณเป็นคนที่ดีที่สุด!