#1 tech recruiter in thailand

3 บทเรียน ที่ได้หลังจากทำงานเป็น Data Scientist

คุณ Soner Yıldırım ซึ่งเป็นเจ้าของบทความนี้ ใช้เวลาเกือบ 2 ปี กว่าที่จะได้ทำงานเป็น Data Scientist แต่หลังจากที่เขาได้เริ่มทำงานเป็น Data Scientist ก็ทำให้เขาได้ข้อคิดบางอย่างที่อยากจะถ่ายทอดให้คนที่กำลังสนใจงานด้านนี้ โดยนี่คือ 3 บทเรียน ที่ได้หลังจากทำงานเป็น Data Scientist

1. SQL คือสิ่งที่จำเป็น

สิ่งที่ขาดไม่ได้ใน Data Science ก็คือ Data หากไม่มี Data ที่ถูกต้อง, ได้รับการ Maintain อย่างดี และเข้าถึงได้ง่าย เราก็ทำอะไรกับมันได้ไม่มากนัก แม้ว่าเราจะพบเห็น NoSQL Databases ได้มากขึ้น แต่บริษัทส่วนใหญ่ก็ยังคงใช้ Relational Databases ในการจัดเก็บ Data

SQL ถือเป็นกุญแจสำคัญใน Relational Databases และเราก็ไม่ได้ใช้ SQL เพื่อเข้าถึงและดึงข้อมูลเท่านั้น แต่ยังเป็น Tool ที่ใช้วิเคราะห์ Data ที่มีประสิทธิภาพอีกด้วย SQL Functions ที่หลากหลายและยืดหยุ่น จะช่วยให้ทำการวิเคราะห์ Data ในขณะที่ดึง Data ได้

เรายังสามารถใช้ IF ในการ Filter และ Transform Data เพื่อให้เราได้เฉพาะ Data ที่เราต้องการเท่านั้น มันช่วยให้เราประหยัดทั้ง Memory และการคำนวณ

คุณ Soner ได้เรียนรู้ SQL ในระหว่างเส้นทาง Data Science ของเขา แต่มันก็ยังไม่เพียงพอ เขายังถือว่าตัวเองเป็นผู้ใช้งาน SQL ได้ในระดับกลางเท่านั้น ถ้าเขาได้เริ่มต้นจริงจังอีกครั้ง เขาน่าจะเป็นผู้ใช้งาน SQL ที่อยู่ในขั้น Advance อย่างแน่นอน

เขาค้นพบถึง ความสามารถของ SQL และมันสำคัญต่อ Data Science Ecosystem อย่างไรบ้าง ดังนั้น หากคุณอยากมีความสามารถในการใช้ SQL ในระดับ Advance ก็ควรฝึกฝนมันให้มาก ๆ

2. Git คือหนทางที่ทำให้ทำงานร่วมกับคนอื่นได้

Git เป็น Version Control System มันจะเก็บประวัติการเปลี่ยนแปลงทั้งหมดที่ทำกับ Code ใน Project การเปลี่ยนแปลงจะถูกเก็บไว้ใน Database พิเศษที่เรียกว่า “Repository” หรือเรียกสั้น ๆ ว่า “Repo”

ข้อดีหลัก ๆ 2 ข้อ ของการใช้ Git ในการพัฒนา Software:

Track การเปลี่ยนแปลงและการ Update ต่าง ๆ เราสามารถดูได้ว่า ใครทำการเปลี่ยนแปลงอะไรไปบ้าง และ Git ยังสามารถระบุเวลาและเหตุผลที่ทำการเปลี่ยนแปลงได้อีกด้วย
มันช่วยให้สามารถทำงานร่วมกันได้ โดย Software Development Projects มักใช้คนจำนวนมากในการทำงานร่วมกัน Git ช่วยให้ Developer สามารถทำงานร่วมกันได้อย่างเป็นระบบ ดังนั้น Developer จึงสามารถ Focus ไปที่ Project แทนที่จะต้องใช้เวลามากมายไปกับการสื่อสารกับ Developers รายอื่น ๆ

ใน Data Science Project ทั่วไป คุณมักจะทำงานร่วมกับคนจำนวนมาก รวมทั้ง Data Engineers, Software Developers หรือ Data Scientist คนอื่นๆ วิธีแรกและสำคัญที่สุดของการสื่อสาร ก็คือ การทำงานผ่าน Git

คุณควรคุ้นเคยกับคำสั่ง Git และ Work Flow เพื่อทำงานร่วมกับเพื่อนร่วมงานของคุณ แม้ว่า Hosting Services อย่าง GitHub และ GitLab จะมี Interface ที่เรียบง่ายสำหรับการใช้งาน Git แต่ก็ขอแนะนำให้คุณเรียนรู้คำสั่ง Git Bash ด้วยเช่นกัน

3. Python ไม่ได้เกี่ยวกับ Pandas เพียงอย่างเดียว

Pandas เป็น Tool ที่ยอดเยี่ยมสำหรับการวิเคราะห์และจัดการ Data ซึ่งคุณ Soner ใช้มาตั้งแต่วันแรกที่เริ่มเดินในเส้นทาง Data Science เขายังใช้งาน Python Libraries อื่นๆ อีกมากมายใน Data Science Ecosystem อย่างเช่น NumPy, Seaborn, Matplotlib, Scikit-learn เป็นต้น

เนื่องจากพวกมันทั้งหมดมีประโยชน์มาก จึงขอแนะนำให้คุณเรียนรู้พวกมัน อย่างไรก็ตาม Python ไม่ได้เกี่ยวกับ Data Science Libraries เพียงอย่างเดียว คุณ Soner เคยรู้สึกว่า เขาจดจ่ออยู่กับการเรียนรู้ Libraries เหล่านี้มากเกินไป ด้วยเหตุนี้ เขาจึงไม่สามารถพัฒนาทักษะ Python ของเขาให้เป็น General-Purpose Language ได้

คุณอาจโต้แย้งว่า Data Scientist ไม่ใช่ Software Developer แต่อย่างไรก็ตาม บริษัทส่วนใหญ่มักจะให้คุณเขียน Script พื้นฐานเพื่อ Implement Projects นอกจากนี้ คุณควรจะสามารถอ่านและทำความเข้าใจ Code ที่ถูกเขียนโดย Data Scientist หรือ Software Developer คนอื่นๆ ได้

มันไม่ได้มีไว้สำหรับ Python เท่านั้น แต่เป็นภาษา Programming ใดก็ตาม ที่คุณเลือกในการเรียนรู้ Data Science แต่ขอให้คุณตรวจสอบให้แน่ใจว่า คุณได้เรียนรู้ใน Scope ครอบคลุมมากกว่าแค่ Data Science Libraries

ISM Technology Recruitment Ltd. (#1 Tech Recruiter in Thailand) เราเชี่ยวชาญในธุรกิจ IT Recruitment & IT Outsourcing โดยเฉพาะ เปิดทำการมา 30 ปี มีพนักงานทุกสายและทุกระดับทางด้าน IT ที่ได้ร่วมงานกับลูกค้าองค์กรใหญ่ที่มีชื่อเสียงและบริษัทข้ามชาติมากมาย

หากคุณเป็นคน IT ที่อยากทำงานท้าทายและร่วมงานกับองค์กรชั้นนำ สามารถฝากประวัติการทำงาน (Resume) ของคุณไว้กับ ISM ได้ที่ https://www.ismtech.net/submit-your-resume แล้วคุณจะพบว่าอนาคตและโอกาสก้าวหน้ากำลังรอคุณอยู่

Source:  https://towardsdatascience.com/

th