Re: [PATCH v5 19/45] target/arm: Implement SME MOVA

qemu-devel

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [PATCH v5 19/45] target/arm: Implement SME MOVA

From:	Peter Maydell
Subject:	Re: [PATCH v5 19/45] target/arm: Implement SME MOVA
Date:	Wed, 6 Jul 2022 17:47:23 +0100

On Wed, 6 Jul 2022 at 10:11, Richard Henderson
<richard.henderson@linaro.org> wrote:
>
> We can reuse the SVE functions for implementing moves to/from
> horizontal tile slices, but we need new ones for moves to/from
> vertical tile slices.
>
> Signed-off-by: Richard Henderson <richard.henderson@linaro.org>


> +/*
> + * Move Zreg vector to ZArray column.
> + */
> +#define DO_MOVA_C(NAME, TYPE, H)                                        \
> +void HELPER(NAME)(void *za, void *vn, void *vg, uint32_t desc)          \
> +{                                                                       \
> +    int i, oprsz = simd_oprsz(desc);                                    \
> +    for (i = 0; i < oprsz; ) {                                          \
> +        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));                 \
> +        do {                                                            \
> +            if (pg & 1) {                                               \
> +                *(TYPE *)(za + tile_vslice_offset(i)) = *(TYPE *)(vn + 
> H(i)); \
> +            }                                                           \
> +            i += sizeof(TYPE);                                          \
> +            pg >>= sizeof(TYPE);                                        \
> +        } while (i & 15);                                               \
> +    }                                                                   \
> +}
> +
> +DO_MOVA_C(sme_mova_cz_b, uint8_t, H1)
> +DO_MOVA_C(sme_mova_cz_h, uint16_t, H2)
> +DO_MOVA_C(sme_mova_cz_s, uint32_t, H4)

i is a byte offset in this loop, so shouldn't these be using H1_2 and H1_4 ?



> +/*
> + * Move ZArray column to Zreg vector.
> + */
> +#define DO_MOVA_Z(NAME, TYPE, H)                                        \
> +void HELPER(NAME)(void *vd, void *za, void *vg, uint32_t desc)          \
> +{                                                                       \
> +    int i, oprsz = simd_oprsz(desc);                                    \
> +    for (i = 0; i < oprsz; ) {                                          \
> +        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));                 \
> +        do {                                                            \
> +            if (pg & 1) {                                               \
> +                *(TYPE *)(vd + H(i)) = *(TYPE *)(za + 
> tile_vslice_offset(i)); \
> +            }                                                           \
> +            i += sizeof(TYPE);                                          \
> +            pg >>= sizeof(TYPE);                                        \
> +        } while (i & 15);                                               \
> +    }                                                                   \
> +}
> +
> +DO_MOVA_Z(sme_mova_zc_b, uint8_t, H1)
> +DO_MOVA_Z(sme_mova_zc_h, uint16_t, H2)
> +DO_MOVA_Z(sme_mova_zc_s, uint32_t, H4)

Similarly here?

Otherwise
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>

thanks
-- PMM

[Prev in Thread]

Current Thread

[Next in Thread]

[PATCH v5 11/45] target/arm: Mark gather/scatter load/store as non-streaming, (continued)
- [PATCH v5 11/45] target/arm: Mark gather/scatter load/store as non-streaming, Richard Henderson, 2022/07/06
- [PATCH v5 04/45] target/arm: Mark ADR as non-streaming, Richard Henderson, 2022/07/06
- [PATCH v5 08/45] target/arm: Mark FTSMUL, FTMAD, FADDA as non-streaming, Richard Henderson, 2022/07/06
- [PATCH v5 13/45] target/arm: Mark LDFF1 and LDNF1 as non-streaming, Richard Henderson, 2022/07/06
- [PATCH v5 12/45] target/arm: Mark gather prefetch as non-streaming, Richard Henderson, 2022/07/06
- [PATCH v5 14/45] target/arm: Mark LD1RO as non-streaming, Richard Henderson, 2022/07/06
- [PATCH v5 15/45] target/arm: Add SME enablement checks, Richard Henderson, 2022/07/06
- [PATCH v5 16/45] target/arm: Handle SME in sve_access_check, Richard Henderson, 2022/07/06
- [PATCH v5 18/45] target/arm: Implement SME ZERO, Richard Henderson, 2022/07/06
- [PATCH v5 19/45] target/arm: Implement SME MOVA, Richard Henderson, 2022/07/06
  - Re: [PATCH v5 19/45] target/arm: Implement SME MOVA, Peter Maydell <=
    - Re: [PATCH v5 19/45] target/arm: Implement SME MOVA, Richard Henderson, 2022/07/06
- [PATCH v5 23/45] target/arm: Implement SME ADDHA, ADDVA, Richard Henderson, 2022/07/06
  - Re: [PATCH v5 23/45] target/arm: Implement SME ADDHA, ADDVA, Peter Maydell, 2022/07/06
- [PATCH v5 20/45] target/arm: Implement SME LD1, ST1, Richard Henderson, 2022/07/06
  - Re: [PATCH v5 20/45] target/arm: Implement SME LD1, ST1, Peter Maydell, 2022/07/06
- [PATCH v5 24/45] target/arm: Implement FMOPA, FMOPS (non-widening), Richard Henderson, 2022/07/06
  - Re: [PATCH v5 24/45] target/arm: Implement FMOPA, FMOPS (non-widening), Peter Maydell, 2022/07/07
- [PATCH v5 27/45] target/arm: Implement SME integer outer product, Richard Henderson, 2022/07/06
- [PATCH v5 26/45] target/arm: Implement FMOPA, FMOPS (widening), Richard Henderson, 2022/07/06
  - Re: [PATCH v5 26/45] target/arm: Implement FMOPA, FMOPS (widening), Peter Maydell, 2022/07/07

Prev by Date: Re: [PATCH RESEND] python/machine: Fix AF_UNIX path too long on macOS
Next by Date: Re: [PATCH v2 9/9] docs: aspeed: Add fby35 multi-SoC machine section
Previous by thread: [PATCH v5 19/45] target/arm: Implement SME MOVA
Next by thread: Re: [PATCH v5 19/45] target/arm: Implement SME MOVA
Index(es):
- Date
- Thread