AVX intrinsics and unrolled loops could help swap large chunks of memory much faster.
貢獻者指南
技術棧
cpp
領域
performance
議題類型
performance
難度面向新貢獻者的預計實作難度,1 表示很小改動,5 表示專家級工作。
3
預計時間有經驗貢獻者完成調查、實作、測試並準備 pull request 的粗略時間範圍。
1-3 hours
活動狀態議題目前的可參與程度:新鮮、活躍、陳舊、阻塞或等待維護者輸入。
stale
清晰度議題是否清楚說明預期改動、驗收標準和下一步。
clear
前置要求
C++ programmingSIMD intrinsics (AVX)Understanding of byte swapping
新手友善度1-100 的估計分數,表示該議題對首次貢獻者的友善程度。
30
研究方向
Investigate the current byte swapping implementation in memory generic.cc. Research AVX intrinsics for 128/256 bit byte swaps. Look into unrolled loop patterns to improve throughput. Test the optimized version for correctness and performance.
Optimize byte swapping routines in memory_generic.cc · xenia-project/xenia#308 | Good First Issue