EP1. 512x512 矩阵乘法 B3615tag:SIMD,fma,cache思路主要来源于 algorithmica。首先矩阵乘法这个东西很适合 SIMD。先启动一下指令集:record1...
这篇文章用于澄清大家对一些 c++ 语法/标准库问题的误区,以正视听。有符号整形算术溢出 是 UB。但是,无符号整数整形溢出 不是 UB。左/右移负数或大于等于数据类型宽度的值 也是 UB。(如...
测试环境:duck.ac运行时间以 ms 为单位,保留两位小数。若运行时长差异较大,则跑 $10$ 次取平均处理,并标注(*)。EP.1 函数递归用于测试的写法:普通函数递归(代码中的 plai...
关于 std::sort(2023.9.19)最近在写一道题,调用 sort 时比较函数有一只 log 的额外复杂度,结果 T 飞了。后来发现把 sort 改成 stable_sort 就过了,...