AVX intrinsics and unrolled loops could help swap large chunks of memory much faster.
贡献者指南
技术栈
cpp
领域
performance
议题类型
performance
难度面向新贡献者的预计实现难度,1 表示很小改动,5 表示专家级工作。
3
预计时间有经验贡献者完成调查、实现、测试并准备 pull request 的粗略时间范围。
1-3 hours
活动状态议题当前的可参与程度:新鲜、活跃、陈旧、阻塞或等待维护者输入。
stale
清晰度议题是否清楚说明期望改动、验收标准和下一步。
clear
前置要求
C++ programmingSIMD intrinsics (AVX)Understanding of byte swapping
新手友好度1-100 的估计分数,表示该议题对首次贡献者的友好程度。
30
研究方向
Investigate the current byte swapping implementation in memory generic.cc. Research AVX intrinsics for 128/256 bit byte swaps. Look into unrolled loop patterns to improve throughput. Test the optimized version for correctness and performance.