ARM64에서 std::memory_order의 실제 비용은 얼마인가? — Jetson Orin 실측 벤치마크
1kHz RT 루프에서 atomic memory ordering이 성능 병목이 될 수 있는지 Jetson Orin(Cortex-A78AE)에서 직접 측정했습니다. AArch64에서 seq_cst와 release/acquire의 비용은 사실상 동일하며, 25개 atomic 연산의 총 비용은 1ms 예산의 0.01% 미만입니다.
1kHz RT 루프에서 atomic memory ordering이 성능 병목이 될 수 있는지 Jetson Orin(Cortex-A78AE)에서 직접 측정했습니다. AArch64에서 seq_cst와 release/acquire의 비용은 사실상 동일하며, 25개 atomic 연산의 총 비용은 1ms 예산의 0.01% 미만입니다.