การคำนวณ
เทคโนโลยีมัลติเธรดที่พร้อมกันและหลากหลายที่ก้าวล้ำเพื่อทำให้การประมวลผลเร็วขึ้น
Securities.io ยึดมั่นในมาตรฐานการบรรณาธิการที่เข้มงวดและอาจได้รับค่าตอบแทนจากลิงก์ที่ได้รับการตรวจสอบ เราไม่ใช่ที่ปรึกษาการลงทุนที่ลงทะเบียนและนี่ไม่ใช่คำแนะนำการลงทุน โปรดดู การเปิดเผยพันธมิตร.

แม้ว่าอุปกรณ์ใหม่ทั้งหมดจากบริษัทยักษ์ใหญ่ด้านเทคโนโลยีอย่าง Apple และ Google จะมีการปรับปรุงเพิ่มขึ้น เช่น อายุการใช้งานแบตเตอรี่เพิ่มขึ้นเพียงหลักเดียว โปรเซสเซอร์ลดลง 1 นาโนเมตร ซึ่งยังให้ผลตอบแทนที่เหมาะสมที่สุดสำหรับผู้ผลิต หรือมีเมกะพิกเซลเพิ่มขึ้นอีกสองสามล้านพิกเซล ซึ่งเป็นคำถาม เกิดขึ้น: การปรุงแต่งเล็กๆ น้อยๆ เช่นนั้นเพียงพอแล้วจริงหรือ? การเพิ่มฮาร์ดแวร์เพิ่มเติมคือการแก้ปัญหาหรือไม่
ไม่เป็นไปตามคำกล่าวของรองศาสตราจารย์ Hung-Wei Tseng จากภาควิชาวิศวกรรมไฟฟ้าและคอมพิวเตอร์ที่มหาวิทยาลัยแคลิฟอร์เนีย ริเวอร์ไซด์ (UCR) เขาพูดว่า:
“คุณไม่จำเป็นต้องเพิ่มโปรเซสเซอร์ใหม่เพราะคุณมีอยู่แล้ว”
ศาสตราจารย์เส็ง พร้อมด้วยทีมนักวิจัย พัฒนากรอบซอฟต์แวร์ใหม่สำหรับการประมวลผลแบบขนาน เรียกว่ามัลติเธรดพร้อมกันและต่างกัน (SHMT) ตามผลลัพธ์เบื้องต้น SHMT พร้อมที่จะเพิ่มความเร็วในการประมวลผลอย่างมีนัยสำคัญ และลดการใช้พลังงานโดยใช้ประโยชน์จากความสามารถแฝงของโปรเซสเซอร์ปัจจุบันในคอมพิวเตอร์ส่วนบุคคล โทรศัพท์มือถือ และอุปกรณ์อื่นๆ
SHMT ได้รับการขนานนามว่าเป็น "แหวกแนว" โดยชุมชนเทคโนโลยี โดยมีจุดมุ่งหมายเพื่อขจัดปัญหาคอขวดของการไหลของข้อมูล และอำนวยความสะดวกในการทำงานร่วมกันอย่างราบรื่นของหน่วยประมวลผลจำนวนมาก ความก้าวหน้านี้อาจส่งผลกระทบไม่เพียงแต่อุปกรณ์อิเล็กทรอนิกส์ส่วนบุคคลเท่านั้น แต่ยังรวมถึงศูนย์ข้อมูลและการประมวลผลแบบขนานขนาดใหญ่ประเภทอื่นๆ ด้วย
คลิกที่นี่เพื่อเรียนรู้ว่าโฟโตนิกส์ขั้นสูงจะช่วยให้เราสร้างสมาร์ทโฟนที่ดีขึ้นได้อย่างไร
ทำลายคอขวด

ก่อนที่เราจะเริ่มต้นสำรวจความรุ่งโรจน์ของสิ่งที่สามารถทำได้ด้วยมัลติเธรดพร้อมกันและต่างกัน ให้เราเข้าใจข้อจำกัดของระบบคอมพิวเตอร์ในปัจจุบันก่อน
ในอุปกรณ์ส่วนใหญ่ ส่วนประกอบต่างๆ เช่น หน่วยประมวลผลกลาง (CPU) หน่วยประมวลผลกราฟิก (GPU) และหน่วยประมวลผลเทนเซอร์ (TPU) จะจัดการข้อมูลแยกกัน ข้อมูลถูกถ่ายโอนจากหน่วยประมวลผลหนึ่งไปยังอีกหน่วยประมวลผลหนึ่ง ซึ่งมักส่งผลให้เกิด “ปัญหาคอขวด” ที่ขัดขวางประสิทธิภาพโดยรวมของระบบ
ปัญหานี้ยิ่งทวีความรุนแรงมากขึ้นจากรูปแบบการเขียนโปรแกรมแบบดั้งเดิม ซึ่งโดยทั่วไปจะมอบหมายงานให้กับโปรเซสเซอร์เพียงตัวเดียว ทำให้ทรัพยากรอื่นๆ ไม่ได้รับการใช้งานและไม่ได้ใช้ประโยชน์อย่างเต็มที่ บทความวิจัยเรื่อง 'Simultaneous and Heterogeneous Multi-threading' โดย Kuan-Chieh Hsu และ Hung-Wei Tseng สะท้อนข้อสังเกตเหล่านี้ โดยระบุว่า:
“โมเดลการเขียนโปรแกรมที่ยึดหลักมุ่งเน้นไปที่การใช้หน่วยประมวลผลที่มีประสิทธิภาพมากที่สุดสำหรับแต่ละขอบเขตโค้ด โดยใช้พลังการประมวลผลภายในคอมพิวเตอร์ที่แตกต่างกันน้อยเกินไป”
SHMT เบี่ยงเบนไปจากแนวทางนี้โดยใช้ประโยชน์จากความหลากหลายของส่วนประกอบต่างๆ ภายในระบบคอมพิวเตอร์ แนวคิดนี้เรียกว่าความหลากหลาย ด้วยการแยกย่อยฟังก์ชันการคำนวณและกระจายไปยังหน่วยประมวลผลที่มีอยู่ SHMT ช่วยให้การประมวลผลแบบขนานที่แท้จริงง่ายขึ้น
วิธีการแยกย่อยฟังก์ชันการคำนวณและกระจายฟังก์ชันเหล่านี้ไปยังหน่วยประมวลผลต่างๆ ช่วยเพิ่มการใช้ทรัพยากรที่มีอยู่ให้เกิดประโยชน์สูงสุดเพื่อปรับปรุงประสิทธิภาพและประหยัดพลังงาน รายงานการวิจัยยังได้วิเคราะห์ข้อบกพร่องของโมเดลการเขียนโปรแกรมแบบดั้งเดิมโดยระบุว่า "สามารถมอบหมายขอบเขตโค้ดให้กับโปรเซสเซอร์ประเภทเดียวเท่านั้น โดยปล่อยให้ทรัพยากรการประมวลผลอื่นๆ ไม่ได้ใช้งานโดยไม่ส่งผลต่อฟังก์ชันปัจจุบัน"
ในทางกลับกัน SHMT มุ่งหวังที่จะหลุดพ้นจากข้อจำกัดเหล่านี้ด้วยการใช้ประโยชน์จากทักษะเฉพาะตัวของแต่ละหน่วยประมวลผลและการทำงานร่วมกันบนพื้นที่โค้ดที่ใช้ร่วมกัน ผู้เขียนยังชี้ให้เห็นว่าเทคโนโลยีการประมวลผลในปัจจุบันมีความหลากหลายอย่างปฏิเสธไม่ได้ เนื่องจากแพลตฟอร์มการประมวลผลทั้งหมดผสานรวมหน่วยประมวลผลและตัวเร่งความเร็วฮาร์ดแวร์หลายประเภทเข้าด้วยกัน สิ่งนี้จึงจำเป็นต้องมีรูปแบบการเขียนโปรแกรมที่สามารถใช้ประโยชน์จากพลังของส่วนประกอบที่หลากหลายเหล่านี้ได้อย่างมีประสิทธิภาพ (ซึ่งเป็นสิ่งที่ SHMT มุ่งหวัง)
ดังนั้น SHMT จึงปูทางไปสู่การประมวลผลที่รวดเร็วและมีประสิทธิภาพยิ่งขึ้นโดยจัดการกับปัญหาคอขวดในการประมวลผลแบบดั้งเดิมในปัจจุบัน
เทคโนโลยีมัลติเธรดที่ทำงานพร้อมกันและต่างกันทำงานอย่างไร
ดังที่เห็นได้ชัด การจัดการและการกระจายกิจกรรมการประมวลผลอย่างมีประสิทธิภาพระหว่างส่วนประกอบฮาร์ดแวร์ต่างๆ เป็นหลักการพื้นฐานเบื้องหลัง SHMT
เฟรมเวิร์กประกอบด้วยคอลเลกชันของการดำเนินการเสมือน (VOP) เพื่ออำนวยความสะดวกในการถ่ายโอนงานจากแอปพลิเคชัน CPU ไปยัง อุปกรณ์ฮาร์ดแวร์เสมือนจากการศึกษาพบว่า “ชุดการดำเนินการเสมือน (VOP) ช่วยให้โปรแกรม CPU สามารถ 'โอน' ฟังก์ชันไปยังอุปกรณ์ฮาร์ดแวร์เสมือนได้” VOP เหล่านี้ทำหน้าที่ไกล่เกลี่ยการสื่อสารและการมอบหมายงานโดยสร้างกำแพงกั้นระหว่างโปรแกรมและฮาร์ดแวร์
ระบบรันไทม์จะเพิ่มประสิทธิภาพการทำงานโดยการประเมินความสามารถของทรัพยากรฮาร์ดแวร์แต่ละรายการและตัดสินใจจัดตารางเวลาอย่างชาญฉลาดในขณะที่แอปพลิเคชันกำลังทำงาน จากการศึกษาพบว่า “ในระหว่างการทำงานของโปรแกรม ระบบรันไทม์จะควบคุมฮาร์ดแวร์เสมือนของมัลติเธรดทั้งแบบพร้อมกันและแบบต่างชนิด เพื่อวัดความสามารถของทรัพยากรฮาร์ดแวร์ในการตัดสินใจจัดตารางเวลา” เพื่อเพิ่มประสิทธิภาพการใช้ทรัพยากรให้สูงสุดและปรับให้เข้ากับความต้องการเฉพาะงาน SHMT จะประเมินความสามารถของฮาร์ดแวร์แบบไดนามิก
ระบบรันไทม์แบ่ง VOP ออกเป็นการดำเนินการระดับสูง (HLOP) เพื่อกระจายไปยังคิวงานฮาร์ดแวร์ต่างๆ จากการศึกษาพบว่า “ระบบรันไทม์แบ่ง VOP ออกเป็นการดำเนินการระดับสูง (HLOP) หนึ่งรายการขึ้นไปเพื่อใช้ทรัพยากรฮาร์ดแวร์หลายตัวพร้อมกัน” การแยกย่อย VOP ออกเป็น HLOP ช่วยให้สามารถควบคุมการจัดสรรงานได้อย่างละเอียดและการใช้งานสูงสุดของแต่ละหน่วยประมวลผล
นโยบายการจัดตารางการทำงานของ SHMT ใช้แนวทางการขโมยงาน (QAWS) ที่คำนึงถึงคุณภาพ เพื่อให้มั่นใจว่ามีการใช้ทรัพยากรอย่างมีประสิทธิภาพและมีปริมาณงานที่หลากหลาย จากการศึกษาพบว่า “SHMT ใช้นโยบายการจัดตารางการทำงานของ SHMT ที่คำนึงถึงคุณภาพ (QAWS) ซึ่งไม่กินทรัพยากรมากเกินไป แต่ช่วยรักษาการควบคุมคุณภาพและสมดุลของปริมาณงาน” นอกจากการกระจายงานอย่างมีประสิทธิภาพทั่วทั้งระบบแล้ว แนวทางนี้ยังป้องกันไม่ให้หน่วยประมวลผลใดๆ กักตุนทรัพยากรไว้
หาก SHMT ต้องการเพิ่มประสิทธิภาพสูงสุดโดยไม่กระทบต่อคุณภาพ จำเป็นต้องมีนโยบายการกำหนดเวลา QAWS การศึกษาระบุว่า “SHMT ต้องรับประกันผลลัพธ์โดยไม่ต้องเสียค่าใช้จ่ายที่มีนัยสำคัญ” เพื่อรับประกันว่าผลลัพธ์จากหน่วยประมวลผลที่แตกต่างกันนั้นแม่นยำและสม่ำเสมอ SHMT จึงรวมเทคนิคการควบคุมคุณภาพเข้ากับการกำหนดเวลา
ความสามารถของ SHMT ในการใช้ความสามารถเฉพาะของฮาร์ดแวร์แต่ละชิ้นถือเป็นข้อดีที่สำคัญ ตามบันทึกการศึกษา "SHMT สามารถแยกการคำนวณจากฟังก์ชันเดียวกันไปยังทรัพยากรการประมวลผลหลายประเภท และใช้ประโยชน์จากความคล้ายคลึงกันประเภทต่าง ๆ ในระหว่างนี้" SHMT เพิ่มประสิทธิภาพอย่างมาก เนื่องจากใช้ความเท่าเทียมในระบบที่ต่างกันเพื่อรันงานพร้อมกันในหน่วยประมวลผลหลายหน่วย
อีกแง่มุมหนึ่งของ SHMT ที่ควรจะมีความยืดหยุ่นและปรับเปลี่ยนได้ก็คือระบบรันไทม์ และจากการศึกษาพบว่า "เนื่องจาก HLOP ไม่ขึ้นอยู่กับฮาร์ดแวร์ ระบบรันไทม์จึงสามารถปรับการมอบหมายงานได้ตามต้องการ" เนื่องจากความสามารถในการปรับตัว SHMT จึงสามารถตอบสนองต่อการเปลี่ยนแปลงความพร้อมใช้งานของฮาร์ดแวร์หรือความต้องการเวิร์กโหลดได้ทันที ทำให้ระบบทำงานได้อย่างมีประสิทธิภาพและประสิทธิภาพสูงสุด
โดยรวมแล้ว การศึกษาได้วางขั้นตอนที่จำเป็นทั้งหมดเพื่อทำความเข้าใจวิธีการทำงานของ SHMT โดยดึงความสนใจไปยังส่วนและกระบวนการที่สำคัญที่ช่วยให้สามารถบรรลุประสิทธิภาพและประสิทธิผลที่โดดเด่นในสภาพแวดล้อมการประมวลผลที่ต่างกัน ต้องขอบคุณ SHMT ซึ่งใช้ VOP, HLOP และกลยุทธ์การกำหนดเวลา QAWS เพื่อปฏิวัติการประมวลผลแบบขนาน ยุคใหม่ของการประมวลผลที่มีประสิทธิภาพและทรงพลังกำลังจะเริ่มต้นขึ้น
ผลการวิจัยเชิงบวกจากการทดสอบต้นแบบเบื้องต้น
เพื่อพิสูจน์ว่า SHMT ใช้งานได้จริง นักวิจัยที่ UCR ได้ทำการทดสอบระบบต้นแบบอย่างเข้มงวด ซึ่งเลียนแบบความสามารถของศูนย์ข้อมูลโดยใช้ชิ้นส่วนมาตรฐานที่มีอยู่ในโทรศัพท์มือถือยุคปัจจุบัน ต้นแบบประกอบด้วย Google Edge TPU ที่รวมเข้ากับช่อง M.2 Key E ของระบบ โมดูล NVIDIA Jetson Nano ที่ใช้โปรเซสเซอร์ ARM Cortex-A57 แบบควอดคอร์ และคอร์ GPU สถาปัตยกรรม Maxwell จำนวน 128 คอร์
เพื่อประเมินประสิทธิภาพของกรอบงาน SHMT ภายใต้สภาวะการทำงานที่แตกต่างกัน นักวิจัยได้นำต้นแบบไปทดสอบกับโปรแกรมเปรียบเทียบประสิทธิภาพหลายชุด ผลลัพธ์ที่ได้น่าประทับใจมาก กลยุทธ์ QAWS ที่มีประสิทธิภาพสูงสุดไม่เพียงแต่ลดการใช้พลังงานลง 51% เท่านั้น แต่ยังเพิ่มประสิทธิภาพการประมวลผลขึ้น 1.95 เท่าเมื่อเทียบกับเทคนิคพื้นฐาน

ผลลัพธ์นี้ตอกย้ำศักยภาพของ SHMT ในการเพิ่มประสิทธิภาพการประมวลผลและประสิทธิภาพการใช้พลังงานได้อย่างมากในอุปกรณ์และแอปพลิเคชันซอฟต์แวร์ที่หลากหลาย SHMT แสดงให้เห็นว่าสามารถใช้ประโยชน์จากการตั้งค่าปัจจุบันได้อย่างเต็มประสิทธิภาพด้วยการใช้ทรัพยากรทั้งหมดให้เกิดประโยชน์สูงสุด โดยไม่ต้องลงทุนซื้อฮาร์ดแวร์ใหม่จำนวนมาก
ด้วยความต้องการการประมวลผลที่รวดเร็วและมีประสิทธิภาพมากขึ้นเรื่อยๆ ความก้าวหน้าต่างๆ เช่น มัลติเธรดที่ทำงานพร้อมกันและต่างกันจะมีความสำคัญมากขึ้นในการกำหนดทิศทางของเทคโนโลยีในอนาคต งานของทีมวิจัย UCR ทำให้ชัดเจนว่าการค้นหาโซลูชันคอมพิวเตอร์ประสิทธิภาพสูงในระยะยาวที่สามารถปรับให้เข้ากับความต้องการแบบไดนามิกของโลกดิจิทัลของเรานั้นง่ายกว่าที่เคยด้วยงานของทีมวิจัย UCR
ผลกระทบและทิศทางในอนาคตของการทำมัลติเธรดพร้อมกันและต่างกัน
การสร้างและการทดสอบ SHMT แสดงถึงการเปลี่ยนแปลงครั้งใหญ่ในอนาคตของการประมวลผล มีศักยภาพในการปฏิวัติการออกแบบอุปกรณ์คอมพิวเตอร์และการใช้งานในแอพพลิเคชั่นต่างๆ โดยนำเสนอประสิทธิภาพที่เพิ่มขึ้นอย่างมากและประหยัดพลังงานด้วยฮาร์ดแวร์ที่มีอยู่
เนื่องจาก SHMT ได้รับการยอมรับในวงกว้างมากขึ้น ผู้บริโภคอาจสามารถหลีกเลี่ยงการอัพเดตฮาร์ดแวร์ราคาแพง และเพลิดเพลินกับอุปกรณ์เคลื่อนที่ แท็บเล็ต แล็ปท็อป และเดสก์ท็อปที่รวดเร็วและตอบสนองมากขึ้น ด้วยเหตุนี้ ผู้คนจำนวนมากจะสามารถซื้อและเข้าถึงคอมพิวเตอร์ประสิทธิภาพสูงได้มากขึ้นในเร็วๆ นี้ ซึ่งจะช่วยปิดช่องว่างทางดิจิทัล
ศูนย์ข้อมูลและระบบคอมพิวเตอร์ขนาดใหญ่อื่นๆ อาจมองว่า SHMT เป็นเครื่องมือที่ขาดไม่ได้สำหรับการลดต้นทุนและการใช้พลังงานโดยไม่กระทบต่อประสิทธิภาพ นอกจากนี้ นวัตกรรมที่ส่งเสริมประสิทธิภาพและความยั่งยืนด้านพลังงาน เช่น SHMT จะมีความสำคัญมากขึ้น เนื่องจากความกังวลเกี่ยวกับผลกระทบต่อสิ่งแวดล้อมของเทคโนโลยีมีมากขึ้น
แม้ว่าจะพยายามอย่างเต็มที่แล้ว แต่ทีมวิจัยของ UCR ตระหนักดีว่ายังมีอุปสรรคที่ต้องเอาชนะและโอกาสในการสืบสวนและความก้าวหน้าเพิ่มเติมในอนาคต วิศวกรซอฟต์แวร์และผู้ผลิตฮาร์ดแวร์จะต้องทำงานร่วมกันอย่างใกล้ชิดเพื่อนำ SHMT ไปใช้ในวงกว้าง สิ่งนี้จะรับประกันได้ว่าเทคโนโลยีจะทำงานได้ดีกับทุกอุปกรณ์และแพลตฟอร์ม อย่างไรก็ตาม จำเป็นต้องมีการวิจัยเพิ่มเติมเพื่อพิจารณาว่าแอปพลิเคชันและปริมาณงานใดที่เหมาะสมที่สุดสำหรับการใช้เทคโนโลยีที่ปฏิวัติวงการนี้
แม้จะมีอุปสรรคเหล่านี้ ทั้งนักวิชาการและภาคธุรกิจต่างก็ให้ความสนใจกับผลลัพธ์เบื้องต้นที่น่าพึงพอใจของ SHMT ความเป็นไปได้ที่เทคโนโลยีอันล้ำสมัยนี้อาจพลิกโฉมอุตสาหกรรมคอมพิวเตอร์กำลังเป็นที่น่าสนใจมากขึ้นเรื่อยๆ เมื่อมีความก้าวหน้าทางการศึกษาและเกิดความร่วมมือกัน
เช่นเดียวกับแนวคิดที่ยอดเยี่ยมอื่น ๆ มัลติเธรดพร้อมกันและต่างกันดูเหมือนจะเป็นผลจากสามัญสำนึก แต่ปีศาจอยู่ในรายละเอียด แม้ว่าแนวคิดเรื่องแคชที่ใช้ร่วมกันระหว่าง CPU และ GPU จะน่าสนใจ แต่ก็มีแนวโน้มว่าจะต้องมีการยกเครื่องสถาปัตยกรรมฮาร์ดแวร์ใหม่ทั้งหมด
จะต้องเปลี่ยนจากสถาปัตยกรรม x86-64 ในปัจจุบัน และการออกแบบดังกล่าวจำเป็นต้องพัฒนาสถาปัตยกรรมโปรเซสเซอร์ใหม่ด้วยแคช L3 หรือ L4 ที่ใช้ร่วมกัน สิ่งนี้จะเพิ่มความซับซ้อนของ CPU และอาจลบล้างผลประโยชน์ใดๆ ที่ได้รับจากแคชที่ใช้ร่วมกัน
ยิ่งไปกว่านั้น หน่วยความจำแคชมักจะมีขนาดเล็กกว่ามากเมื่อเทียบกับ RAM ของระบบ และไม่เหมาะกับแอปพลิเคชัน GPU ซึ่งต้องใช้หน่วยความจำแบนด์วิธสูงจำนวนมาก อย่างไรก็ตามการพัฒนาเช่น หน่วยความจำสากล อาจแก้ไขข้อกังวลเหล่านี้ได้ ในขณะที่การวิจัยเกี่ยวกับ SHMT ยังคงดำเนินต่อไป จะเป็นเรื่องน่าตื่นเต้นที่ได้เห็นว่าเทคโนโลยีที่เป็นนวัตกรรมนี้มีการพัฒนาและส่งผลกระทบต่ออนาคตของการประมวลผลแบบขนานและการประมวลผลแบบต่างกันอย่างไร










