タグ

AVXに関するk_oshimaのブックマーク (3)

  • 今アツイ𝕏といえば… ISA e𝕏tension! AV𝕏10とAP𝕏で夏を乗りこえよう - Qiita


    20237Intel APX(Advanced Performance Extension)  AVX10  x86SIMDAPX 使  (1632) 3 operand   APX REX2 prefixprefix(prefix) REX2 prefix0xD5 0xD5  32bit  AAD  x86使32bit  x86 BCD 
    今アツイ𝕏といえば… ISA e𝕏tension! AV𝕏10とAP𝕏で夏を乗りこえよう - Qiita
  • 或るプログラマの一生 » UTF-8のコードポイントはどうやってもっと高速に数えるか

    Qiita に UTF-8のコードポイントはどうやって高速に数えるかという記事がありました。コードを眺めながらもっと速くなるんじゃないのと思ったので、やってみようと思います。 元のコードはこうなっています。 inline int32_t avx2_horizontal_sum_epi8(__m256i x) { __m256i sumhi = _mm256_unpackhi_epi8(x, _mm256_setzero_si256()); __m256i sumlo = _mm256_unpacklo_epi8(x, _mm256_setzero_si256()); __m256i sum16x16 = _mm256_add_epi16(sumhi, sumlo); __m256i sum16x8 = _mm256_add_epi16(sum16x16, _mm256_permute2x1

  • UTF-8のコードポイントはどうやって高速に数えるか - Qiita


    UTF-8  Ruby(CRuby)(string.c)使 CSIMD(AVX/AVX2)使   UTF-8 Ruby (leading byte)
    UTF-8のコードポイントはどうやって高速に数えるか - Qiita
  • 1