x86: drop need_vex_reg
[deliverable/binutils-gdb.git] / opcodes / i386-dis.c
index 7f521b2766f4f566289e006c587d3c267ce2fb7f..3b8eb3009745faa75189875d9d2e1625be8052c5 100644 (file)
@@ -88,15 +88,12 @@ static void OP_MS (int, int);
 static void OP_XS (int, int);
 static void OP_M (int, int);
 static void OP_VEX (int, int);
-static void OP_EX_Vex (int, int);
-static void OP_EX_VexW (int, int);
-static void OP_EX_VexImmW (int, int);
-static void OP_XMM_Vex (int, int);
-static void OP_XMM_VexW (int, int);
+static void OP_VexR (int, int);
+static void OP_VexW (int, int);
 static void OP_Rounding (int, int);
 static void OP_REG_VexI4 (int, int);
+static void OP_VexI4 (int, int);
 static void PCLMUL_Fixup (int, int);
-static void VCMP_Fixup (int, int);
 static void VPCMP_Fixup (int, int);
 static void VPCOM_Fixup (int, int);
 static void OP_0f07 (int, int);
@@ -116,15 +113,8 @@ static void HLE_Fixup2 (int, int);
 static void HLE_Fixup3 (int, int);
 static void CMPXCHG8B_Fixup (int, int);
 static void XMM_Fixup (int, int);
-static void CRC32_Fixup (int, int);
 static void FXSAVE_Fixup (int, int);
-static void PCMPESTR_Fixup (int, int);
-static void OP_LWPCB_E (int, int);
-static void OP_LWP_E (int, int);
-static void OP_Vex_2src_1 (int, int);
-static void OP_Vex_2src_2 (int, int);
 
-static void MOVBE_Fixup (int, int);
 static void MOVSXD_Fixup (int, int);
 
 static void OP_Mask (int, int);
@@ -272,6 +262,7 @@ fetch_data (struct disassemble_info *info, bfd_byte *addr)
 #define Mo { OP_M, o_mode }
 #define Mp { OP_M, f_mode }            /* 32 or 48 bit memory operand for LDS, LES etc */
 #define Mq { OP_M, q_mode }
+#define Mv { OP_M, v_mode }
 #define Mv_bnd { OP_M, v_bndmk_mode }
 #define Mx { OP_M, x_mode }
 #define Mxmm { OP_M, xmm_mode }
@@ -331,23 +322,8 @@ fetch_data (struct disassemble_info *info, bfd_byte *addr)
 #define RMDX { OP_REG, dx_reg }
 
 #define eAX { OP_IMREG, eAX_reg }
-#define eBX { OP_IMREG, eBX_reg }
-#define eCX { OP_IMREG, eCX_reg }
-#define eDX { OP_IMREG, eDX_reg }
-#define eSP { OP_IMREG, eSP_reg }
-#define eBP { OP_IMREG, eBP_reg }
-#define eSI { OP_IMREG, eSI_reg }
-#define eDI { OP_IMREG, eDI_reg }
 #define AL { OP_IMREG, al_reg }
 #define CL { OP_IMREG, cl_reg }
-#define DL { OP_IMREG, dl_reg }
-#define BL { OP_IMREG, bl_reg }
-#define AH { OP_IMREG, ah_reg }
-#define CH { OP_IMREG, ch_reg }
-#define DH { OP_IMREG, dh_reg }
-#define BH { OP_IMREG, bh_reg }
-#define AX { OP_IMREG, ax_reg }
-#define DX { OP_IMREG, dx_reg }
 #define zAX { OP_IMREG, z_mode_ax_reg }
 #define indirDX { OP_IMREG, indir_dx_reg }
 
@@ -375,14 +351,14 @@ fetch_data (struct disassemble_info *info, bfd_byte *addr)
 #define XMScalar { OP_XMM, scalar_mode }
 #define XMGatherQ { OP_XMM, vex_vsib_q_w_dq_mode }
 #define XMM { OP_XMM, xmm_mode }
+#define TMM { OP_XMM, tmm_mode }
 #define XMxmmq { OP_XMM, xmmq_mode }
 #define EM { OP_EM, v_mode }
 #define EMS { OP_EM, v_swap_mode }
 #define EMd { OP_EM, d_mode }
 #define EMx { OP_EM, x_mode }
-#define EXbScalar { OP_EX, b_scalar_mode }
+#define EXbwUnit { OP_EX, bw_unit_mode }
 #define EXw { OP_EX, w_mode }
-#define EXwScalar { OP_EX, w_scalar_mode }
 #define EXd { OP_EX, d_mode }
 #define EXdS { OP_EX, d_swap_mode }
 #define EXq { OP_EX, q_mode }
@@ -391,6 +367,7 @@ fetch_data (struct disassemble_info *info, bfd_byte *addr)
 #define EXxS { OP_EX, x_swap_mode }
 #define EXxmm { OP_EX, xmm_mode }
 #define EXymm { OP_EX, ymm_mode }
+#define EXtmm { OP_EX, tmm_mode }
 #define EXxmmq { OP_EX, xmmq_mode }
 #define EXEvexHalfBcstXmmq { OP_EX, evex_half_bcst_xmmq_mode }
 #define EXxmm_mb { OP_EX, xmm_mb_mode }
@@ -412,26 +389,18 @@ fetch_data (struct disassemble_info *info, bfd_byte *addr)
 #define CMP { CMP_Fixup, 0 }
 #define XMM0 { XMM_Fixup, 0 }
 #define FXSAVE { FXSAVE_Fixup, 0 }
-#define Vex_2src_1 { OP_Vex_2src_1, 0 }
-#define Vex_2src_2 { OP_Vex_2src_2, 0 }
 
 #define Vex { OP_VEX, vex_mode }
+#define VexW { OP_VexW, vex_mode }
 #define VexScalar { OP_VEX, vex_scalar_mode }
+#define VexScalarR { OP_VexR, vex_scalar_mode }
 #define VexGatherQ { OP_VEX, vex_vsib_q_w_dq_mode }
-#define Vex128 { OP_VEX, vex128_mode }
-#define Vex256 { OP_VEX, vex256_mode }
 #define VexGdq { OP_VEX, dq_mode }
-#define EXdVexScalarS { OP_EX_Vex, d_scalar_swap_mode }
-#define EXqVexScalarS { OP_EX_Vex, q_scalar_swap_mode }
-#define EXVexW { OP_EX_VexW, x_mode }
-#define EXdVexW { OP_EX_VexW, d_mode }
-#define EXqVexW { OP_EX_VexW, q_mode }
-#define EXVexImmW { OP_EX_VexImmW, x_mode }
-#define XMVexScalar { OP_XMM_Vex, scalar_mode }
-#define XMVexW { OP_XMM_VexW, 0 }
+#define VexTmm { OP_VEX, tmm_mode }
 #define XMVexI4 { OP_REG_VexI4, x_mode }
+#define XMVexScalarI4 { OP_REG_VexI4, scalar_mode }
+#define VexI4 { OP_VexI4, 0 }
 #define PCLMUL { PCLMUL_Fixup, 0 }
-#define VCMP { VCMP_Fixup, 0 }
 #define VPCMP { VPCMP_Fixup, 0 }
 #define VPCOM { VPCOM_Fixup, 0 }
 
@@ -451,6 +420,8 @@ fetch_data (struct disassemble_info *info, bfd_byte *addr)
 #define MVexVSIBQWpX { OP_M, vex_vsib_q_w_dq_mode }
 #define MVexVSIBQDWpX { OP_M, vex_vsib_q_w_d_mode }
 
+#define MVexSIBMEM { OP_M, vex_sibmem_mode }
+
 /* Used handle "rep" prefix for string instructions.  */
 #define Xbr { REP_Fixup, eSI_reg }
 #define Xvr { REP_Fixup, eSI_reg }
@@ -511,6 +482,8 @@ enum
   x_mode,
   /* Similar to x_mode, but with different EVEX mem shifts.  */
   evex_x_gscat_mode,
+  /* Similar to x_mode, but with yet different EVEX mem shifts.  */
+  bw_unit_mode,
   /* Similar to x_mode, but with disabled broadcast.  */
   evex_x_nobcst_mode,
   /* Similar to x_mode, but with operands swapped and disabled broadcast
@@ -542,6 +515,8 @@ enum
   ymmq_mode,
   /* 32-byte YMM or 16-byte word operand */
   ymmxmm_mode,
+  /* TMM operand */
+  tmm_mode,
   /* d_mode in 32bit, q_mode in 64bit mode.  */
   m_mode,
   /* pair of v_mode operands */
@@ -582,10 +557,6 @@ enum
   dqd_mode,
   /* normal vex mode */
   vex_mode,
-  /* 128bit vex mode */
-  vex128_mode,
-  /* 256bit vex mode */
-  vex256_mode,
 
   /* Operand size depends on the VEX.W bit, with VSIB dword indices.  */
   vex_vsib_d_w_dq_mode,
@@ -595,17 +566,11 @@ enum
   vex_vsib_q_w_dq_mode,
   /* Similar to vex_vsib_q_w_dq_mode, with smaller memory.  */
   vex_vsib_q_w_d_mode,
+  /* mandatory non-vector SIB.  */
+  vex_sibmem_mode,
 
   /* scalar, ignore vector length.  */
   scalar_mode,
-  /* like b_mode, ignore vector length.  */
-  b_scalar_mode,
-  /* like w_mode, ignore vector length.  */
-  w_scalar_mode,
-  /* like d_swap_mode, ignore vector length.  */
-  d_scalar_swap_mode,
-  /* like q_swap_mode, ignore vector length.  */
-  q_scalar_swap_mode,
   /* like vex_mode, ignore vector length.  */
   vex_scalar_mode,
   /* Operand size depends on the VEX.W bit, ignore vector length.  */
@@ -743,11 +708,13 @@ enum
   REG_VEX_0F72,
   REG_VEX_0F73,
   REG_VEX_0FAE,
+  REG_VEX_0F3849_X86_64_P_0_W_0_M_1,
   REG_VEX_0F38F3,
-  REG_XOP_LWPCB,
-  REG_XOP_LWP,
-  REG_XOP_TBM_01,
-  REG_XOP_TBM_02,
+
+  REG_0FXOP_09_01_L_0,
+  REG_0FXOP_09_02_L_0,
+  REG_0FXOP_09_12_M_1_L_0,
+  REG_0FXOP_0A_12_L_0,
 
   REG_EVEX_0F71,
   REG_EVEX_0F72,
@@ -826,6 +793,17 @@ enum
   MOD_0FE7_PREFIX_2,
   MOD_0FF0_PREFIX_3,
   MOD_0F382A_PREFIX_2,
+  MOD_VEX_0F3849_X86_64_P_0_W_0,
+  MOD_VEX_0F3849_X86_64_P_2_W_0,
+  MOD_VEX_0F3849_X86_64_P_3_W_0,
+  MOD_VEX_0F384B_X86_64_P_1_W_0,
+  MOD_VEX_0F384B_X86_64_P_2_W_0,
+  MOD_VEX_0F384B_X86_64_P_3_W_0,
+  MOD_VEX_0F385C_X86_64_P_1_W_0,
+  MOD_VEX_0F385E_X86_64_P_0_W_0,
+  MOD_VEX_0F385E_X86_64_P_1_W_0,
+  MOD_VEX_0F385E_X86_64_P_2_W_0,
+  MOD_VEX_0F385E_X86_64_P_3_W_0,
   MOD_0F38F5_PREFIX_2,
   MOD_0F38F6_PREFIX_0,
   MOD_0F38F8_PREFIX_1,
@@ -925,6 +903,8 @@ enum
   MOD_VEX_W_0_0F3A33_P_2_LEN_0,
   MOD_VEX_W_1_0F3A33_P_2_LEN_0,
 
+  MOD_VEX_0FXOP_09_12,
+
   MOD_EVEX_0F12_PREFIX_0,
   MOD_EVEX_0F12_PREFIX_2,
   MOD_EVEX_0F13,
@@ -932,6 +912,14 @@ enum
   MOD_EVEX_0F16_PREFIX_2,
   MOD_EVEX_0F17,
   MOD_EVEX_0F2B,
+  MOD_EVEX_0F381A_P_2_W_0,
+  MOD_EVEX_0F381A_P_2_W_1,
+  MOD_EVEX_0F381B_P_2_W_0,
+  MOD_EVEX_0F381B_P_2_W_1,
+  MOD_EVEX_0F385A_P_2_W_0,
+  MOD_EVEX_0F385A_P_2_W_1,
+  MOD_EVEX_0F385B_P_2_W_0,
+  MOD_EVEX_0F385B_P_2_W_1,
   MOD_EVEX_0F38C6_REG_1,
   MOD_EVEX_0F38C6_REG_2,
   MOD_EVEX_0F38C6_REG_5,
@@ -955,6 +943,7 @@ enum
   RM_0F1E_P_1_MOD_3_REG_7,
   RM_0FAE_REG_6_MOD_3_P_0,
   RM_0FAE_REG_7_MOD_3,
+  RM_VEX_0F3849_X86_64_P_0_W_0_M_1_R_0
 };
 
 enum
@@ -1290,9 +1279,13 @@ enum
   PREFIX_VEX_0F3845,
   PREFIX_VEX_0F3846,
   PREFIX_VEX_0F3847,
+  PREFIX_VEX_0F3849_X86_64,
+  PREFIX_VEX_0F384B_X86_64,
   PREFIX_VEX_0F3858,
   PREFIX_VEX_0F3859,
   PREFIX_VEX_0F385A,
+  PREFIX_VEX_0F385C_X86_64,
+  PREFIX_VEX_0F385E_X86_64,
   PREFIX_VEX_0F3878,
   PREFIX_VEX_0F3879,
   PREFIX_VEX_0F388C,
@@ -1431,14 +1424,9 @@ enum
   PREFIX_EVEX_0F5D,
   PREFIX_EVEX_0F5E,
   PREFIX_EVEX_0F5F,
-  PREFIX_EVEX_0F62,
   PREFIX_EVEX_0F64,
   PREFIX_EVEX_0F65,
   PREFIX_EVEX_0F66,
-  PREFIX_EVEX_0F6A,
-  PREFIX_EVEX_0F6B,
-  PREFIX_EVEX_0F6C,
-  PREFIX_EVEX_0F6D,
   PREFIX_EVEX_0F6E,
   PREFIX_EVEX_0F6F,
   PREFIX_EVEX_0F70,
@@ -1466,9 +1454,6 @@ enum
   PREFIX_EVEX_0FC2,
   PREFIX_EVEX_0FC4,
   PREFIX_EVEX_0FC5,
-  PREFIX_EVEX_0FD2,
-  PREFIX_EVEX_0FD3,
-  PREFIX_EVEX_0FD4,
   PREFIX_EVEX_0FD6,
   PREFIX_EVEX_0FDB,
   PREFIX_EVEX_0FDF,
@@ -1477,12 +1462,6 @@ enum
   PREFIX_EVEX_0FE7,
   PREFIX_EVEX_0FEB,
   PREFIX_EVEX_0FEF,
-  PREFIX_EVEX_0FF2,
-  PREFIX_EVEX_0FF3,
-  PREFIX_EVEX_0FF4,
-  PREFIX_EVEX_0FFA,
-  PREFIX_EVEX_0FFB,
-  PREFIX_EVEX_0FFE,
   PREFIX_EVEX_0F380D,
   PREFIX_EVEX_0F3810,
   PREFIX_EVEX_0F3811,
@@ -1507,7 +1486,6 @@ enum
   PREFIX_EVEX_0F3828,
   PREFIX_EVEX_0F3829,
   PREFIX_EVEX_0F382A,
-  PREFIX_EVEX_0F382B,
   PREFIX_EVEX_0F382C,
   PREFIX_EVEX_0F382D,
   PREFIX_EVEX_0F3830,
@@ -1680,7 +1658,11 @@ enum
   X86_64_0F01_REG_0,
   X86_64_0F01_REG_1,
   X86_64_0F01_REG_2,
-  X86_64_0F01_REG_3
+  X86_64_0F01_REG_3,
+  X86_64_VEX_0F3849,
+  X86_64_VEX_0F384B,
+  X86_64_VEX_0F385C,
+  X86_64_VEX_0F385E
 };
 
 enum
@@ -1765,7 +1747,19 @@ enum
   VEX_LEN_0F381A_P_2_M_0,
   VEX_LEN_0F3836_P_2,
   VEX_LEN_0F3841_P_2,
+  VEX_LEN_0F3849_X86_64_P_0_W_0_M_0,
+  VEX_LEN_0F3849_X86_64_P_0_W_0_M_1_REG_0_RM_0,
+  VEX_LEN_0F3849_X86_64_P_2_W_0_M_0,
+  VEX_LEN_0F3849_X86_64_P_3_W_0_M_0,
+  VEX_LEN_0F384B_X86_64_P_1_W_0_M_0,
+  VEX_LEN_0F384B_X86_64_P_2_W_0_M_0,
+  VEX_LEN_0F384B_X86_64_P_3_W_0_M_0,
   VEX_LEN_0F385A_P_2_M_0,
+  VEX_LEN_0F385C_X86_64_P_1_W_0_M_0,
+  VEX_LEN_0F385E_X86_64_P_0_W_0_M_0,
+  VEX_LEN_0F385E_X86_64_P_1_W_0_M_0,
+  VEX_LEN_0F385E_X86_64_P_2_W_0_M_0,
+  VEX_LEN_0F385E_X86_64_P_3_W_0_M_0,
   VEX_LEN_0F38DB_P_2,
   VEX_LEN_0F38F2_P_0,
   VEX_LEN_0F38F3_R_1_P_0,
@@ -1803,16 +1797,25 @@ enum
   VEX_LEN_0F3A61_P_2,
   VEX_LEN_0F3A62_P_2,
   VEX_LEN_0F3A63_P_2,
-  VEX_LEN_0F3A6A_P_2,
-  VEX_LEN_0F3A6B_P_2,
-  VEX_LEN_0F3A6E_P_2,
-  VEX_LEN_0F3A6F_P_2,
-  VEX_LEN_0F3A7A_P_2,
-  VEX_LEN_0F3A7B_P_2,
-  VEX_LEN_0F3A7E_P_2,
-  VEX_LEN_0F3A7F_P_2,
   VEX_LEN_0F3ADF_P_2,
   VEX_LEN_0F3AF0_P_3,
+  VEX_LEN_0FXOP_08_85,
+  VEX_LEN_0FXOP_08_86,
+  VEX_LEN_0FXOP_08_87,
+  VEX_LEN_0FXOP_08_8E,
+  VEX_LEN_0FXOP_08_8F,
+  VEX_LEN_0FXOP_08_95,
+  VEX_LEN_0FXOP_08_96,
+  VEX_LEN_0FXOP_08_97,
+  VEX_LEN_0FXOP_08_9E,
+  VEX_LEN_0FXOP_08_9F,
+  VEX_LEN_0FXOP_08_A3,
+  VEX_LEN_0FXOP_08_A6,
+  VEX_LEN_0FXOP_08_B6,
+  VEX_LEN_0FXOP_08_C0,
+  VEX_LEN_0FXOP_08_C1,
+  VEX_LEN_0FXOP_08_C2,
+  VEX_LEN_0FXOP_08_C3,
   VEX_LEN_0FXOP_08_CC,
   VEX_LEN_0FXOP_08_CD,
   VEX_LEN_0FXOP_08_CE,
@@ -1821,8 +1824,39 @@ enum
   VEX_LEN_0FXOP_08_ED,
   VEX_LEN_0FXOP_08_EE,
   VEX_LEN_0FXOP_08_EF,
-  VEX_LEN_0FXOP_09_80,
-  VEX_LEN_0FXOP_09_81
+  VEX_LEN_0FXOP_09_01,
+  VEX_LEN_0FXOP_09_02,
+  VEX_LEN_0FXOP_09_12_M_1,
+  VEX_LEN_0FXOP_09_82_W_0,
+  VEX_LEN_0FXOP_09_83_W_0,
+  VEX_LEN_0FXOP_09_90,
+  VEX_LEN_0FXOP_09_91,
+  VEX_LEN_0FXOP_09_92,
+  VEX_LEN_0FXOP_09_93,
+  VEX_LEN_0FXOP_09_94,
+  VEX_LEN_0FXOP_09_95,
+  VEX_LEN_0FXOP_09_96,
+  VEX_LEN_0FXOP_09_97,
+  VEX_LEN_0FXOP_09_98,
+  VEX_LEN_0FXOP_09_99,
+  VEX_LEN_0FXOP_09_9A,
+  VEX_LEN_0FXOP_09_9B,
+  VEX_LEN_0FXOP_09_C1,
+  VEX_LEN_0FXOP_09_C2,
+  VEX_LEN_0FXOP_09_C3,
+  VEX_LEN_0FXOP_09_C6,
+  VEX_LEN_0FXOP_09_C7,
+  VEX_LEN_0FXOP_09_CB,
+  VEX_LEN_0FXOP_09_D1,
+  VEX_LEN_0FXOP_09_D2,
+  VEX_LEN_0FXOP_09_D3,
+  VEX_LEN_0FXOP_09_D6,
+  VEX_LEN_0FXOP_09_D7,
+  VEX_LEN_0FXOP_09_DB,
+  VEX_LEN_0FXOP_09_E1,
+  VEX_LEN_0FXOP_09_E2,
+  VEX_LEN_0FXOP_09_E3,
+  VEX_LEN_0FXOP_0A_12,
 };
 
 enum
@@ -1830,17 +1864,21 @@ enum
   EVEX_LEN_0F6E_P_2 = 0,
   EVEX_LEN_0F7E_P_1,
   EVEX_LEN_0F7E_P_2,
+  EVEX_LEN_0FC4_P_2,
+  EVEX_LEN_0FC5_P_2,
   EVEX_LEN_0FD6_P_2,
+  EVEX_LEN_0F3816_P_2,
   EVEX_LEN_0F3819_P_2_W_0,
   EVEX_LEN_0F3819_P_2_W_1,
-  EVEX_LEN_0F381A_P_2_W_0,
-  EVEX_LEN_0F381A_P_2_W_1,
-  EVEX_LEN_0F381B_P_2_W_0,
-  EVEX_LEN_0F381B_P_2_W_1,
-  EVEX_LEN_0F385A_P_2_W_0,
-  EVEX_LEN_0F385A_P_2_W_1,
-  EVEX_LEN_0F385B_P_2_W_0,
-  EVEX_LEN_0F385B_P_2_W_1,
+  EVEX_LEN_0F381A_P_2_W_0_M_0,
+  EVEX_LEN_0F381A_P_2_W_1_M_0,
+  EVEX_LEN_0F381B_P_2_W_0_M_0,
+  EVEX_LEN_0F381B_P_2_W_1_M_0,
+  EVEX_LEN_0F3836_P_2,
+  EVEX_LEN_0F385A_P_2_W_0_M_0,
+  EVEX_LEN_0F385A_P_2_W_1_M_0,
+  EVEX_LEN_0F385B_P_2_W_0_M_0,
+  EVEX_LEN_0F385B_P_2_W_1_M_0,
   EVEX_LEN_0F38C6_REG_1_PREFIX_2,
   EVEX_LEN_0F38C6_REG_2_PREFIX_2,
   EVEX_LEN_0F38C6_REG_5_PREFIX_2,
@@ -1853,6 +1891,12 @@ enum
   EVEX_LEN_0F38C7_R_5_P_2_W_1,
   EVEX_LEN_0F38C7_R_6_P_2_W_0,
   EVEX_LEN_0F38C7_R_6_P_2_W_1,
+  EVEX_LEN_0F3A00_P_2_W_1,
+  EVEX_LEN_0F3A01_P_2_W_1,
+  EVEX_LEN_0F3A14_P_2,
+  EVEX_LEN_0F3A15_P_2,
+  EVEX_LEN_0F3A16_P_2,
+  EVEX_LEN_0F3A17_P_2,
   EVEX_LEN_0F3A18_P_2_W_0,
   EVEX_LEN_0F3A18_P_2_W_1,
   EVEX_LEN_0F3A19_P_2_W_0,
@@ -1861,6 +1905,9 @@ enum
   EVEX_LEN_0F3A1A_P_2_W_1,
   EVEX_LEN_0F3A1B_P_2_W_0,
   EVEX_LEN_0F3A1B_P_2_W_1,
+  EVEX_LEN_0F3A20_P_2,
+  EVEX_LEN_0F3A21_P_2_W_0,
+  EVEX_LEN_0F3A22_P_2,
   EVEX_LEN_0F3A23_P_2_W_0,
   EVEX_LEN_0F3A23_P_2_W_1,
   EVEX_LEN_0F3A38_P_2_W_0,
@@ -1913,16 +1960,27 @@ enum
   VEX_W_0F3816_P_2,
   VEX_W_0F3818_P_2,
   VEX_W_0F3819_P_2,
-  VEX_W_0F381A_P_2_M_0,
+  VEX_W_0F381A_P_2_M_0_L_0,
   VEX_W_0F382C_P_2_M_0,
   VEX_W_0F382D_P_2_M_0,
   VEX_W_0F382E_P_2_M_0,
   VEX_W_0F382F_P_2_M_0,
   VEX_W_0F3836_P_2,
   VEX_W_0F3846_P_2,
+  VEX_W_0F3849_X86_64_P_0,
+  VEX_W_0F3849_X86_64_P_2,
+  VEX_W_0F3849_X86_64_P_3,
+  VEX_W_0F384B_X86_64_P_1,
+  VEX_W_0F384B_X86_64_P_2,
+  VEX_W_0F384B_X86_64_P_3,
   VEX_W_0F3858_P_2,
   VEX_W_0F3859_P_2,
-  VEX_W_0F385A_P_2_M_0,
+  VEX_W_0F385A_P_2_M_0_L_0,
+  VEX_W_0F385C_X86_64_P_1,
+  VEX_W_0F385E_X86_64_P_0,
+  VEX_W_0F385E_X86_64_P_1,
+  VEX_W_0F385E_X86_64_P_2,
+  VEX_W_0F385E_X86_64_P_3,
   VEX_W_0F3878_P_2,
   VEX_W_0F3879_P_2,
   VEX_W_0F38CF_P_2,
@@ -1931,25 +1989,68 @@ enum
   VEX_W_0F3A02_P_2,
   VEX_W_0F3A04_P_2,
   VEX_W_0F3A05_P_2,
-  VEX_W_0F3A06_P_2,
-  VEX_W_0F3A18_P_2,
-  VEX_W_0F3A19_P_2,
+  VEX_W_0F3A06_P_2_L_0,
+  VEX_W_0F3A18_P_2_L_0,
+  VEX_W_0F3A19_P_2_L_0,
   VEX_W_0F3A1D_P_2,
   VEX_W_0F3A30_P_2_LEN_0,
   VEX_W_0F3A31_P_2_LEN_0,
   VEX_W_0F3A32_P_2_LEN_0,
   VEX_W_0F3A33_P_2_LEN_0,
-  VEX_W_0F3A38_P_2,
-  VEX_W_0F3A39_P_2,
-  VEX_W_0F3A46_P_2,
-  VEX_W_0F3A48_P_2,
-  VEX_W_0F3A49_P_2,
+  VEX_W_0F3A38_P_2_L_0,
+  VEX_W_0F3A39_P_2_L_0,
+  VEX_W_0F3A46_P_2_L_0,
   VEX_W_0F3A4A_P_2,
   VEX_W_0F3A4B_P_2,
   VEX_W_0F3A4C_P_2,
   VEX_W_0F3ACE_P_2,
   VEX_W_0F3ACF_P_2,
 
+  VEX_W_0FXOP_08_85_L_0,
+  VEX_W_0FXOP_08_86_L_0,
+  VEX_W_0FXOP_08_87_L_0,
+  VEX_W_0FXOP_08_8E_L_0,
+  VEX_W_0FXOP_08_8F_L_0,
+  VEX_W_0FXOP_08_95_L_0,
+  VEX_W_0FXOP_08_96_L_0,
+  VEX_W_0FXOP_08_97_L_0,
+  VEX_W_0FXOP_08_9E_L_0,
+  VEX_W_0FXOP_08_9F_L_0,
+  VEX_W_0FXOP_08_A6_L_0,
+  VEX_W_0FXOP_08_B6_L_0,
+  VEX_W_0FXOP_08_C0_L_0,
+  VEX_W_0FXOP_08_C1_L_0,
+  VEX_W_0FXOP_08_C2_L_0,
+  VEX_W_0FXOP_08_C3_L_0,
+  VEX_W_0FXOP_08_CC_L_0,
+  VEX_W_0FXOP_08_CD_L_0,
+  VEX_W_0FXOP_08_CE_L_0,
+  VEX_W_0FXOP_08_CF_L_0,
+  VEX_W_0FXOP_08_EC_L_0,
+  VEX_W_0FXOP_08_ED_L_0,
+  VEX_W_0FXOP_08_EE_L_0,
+  VEX_W_0FXOP_08_EF_L_0,
+
+  VEX_W_0FXOP_09_80,
+  VEX_W_0FXOP_09_81,
+  VEX_W_0FXOP_09_82,
+  VEX_W_0FXOP_09_83,
+  VEX_W_0FXOP_09_C1_L_0,
+  VEX_W_0FXOP_09_C2_L_0,
+  VEX_W_0FXOP_09_C3_L_0,
+  VEX_W_0FXOP_09_C6_L_0,
+  VEX_W_0FXOP_09_C7_L_0,
+  VEX_W_0FXOP_09_CB_L_0,
+  VEX_W_0FXOP_09_D1_L_0,
+  VEX_W_0FXOP_09_D2_L_0,
+  VEX_W_0FXOP_09_D3_L_0,
+  VEX_W_0FXOP_09_D6_L_0,
+  VEX_W_0FXOP_09_D7_L_0,
+  VEX_W_0FXOP_09_DB_L_0,
+  VEX_W_0FXOP_09_E1_L_0,
+  VEX_W_0FXOP_09_E2_L_0,
+  VEX_W_0FXOP_09_E3_L_0,
+
   EVEX_W_0F10_P_1,
   EVEX_W_0F10_P_3,
   EVEX_W_0F11_P_1,
@@ -1981,12 +2082,12 @@ enum
   EVEX_W_0F5E_P_3,
   EVEX_W_0F5F_P_1,
   EVEX_W_0F5F_P_3,
-  EVEX_W_0F62_P_2,
+  EVEX_W_0F62,
   EVEX_W_0F66_P_2,
-  EVEX_W_0F6A_P_2,
-  EVEX_W_0F6B_P_2,
-  EVEX_W_0F6C_P_2,
-  EVEX_W_0F6D_P_2,
+  EVEX_W_0F6A,
+  EVEX_W_0F6B,
+  EVEX_W_0F6C,
+  EVEX_W_0F6D,
   EVEX_W_0F6F_P_1,
   EVEX_W_0F6F_P_2,
   EVEX_W_0F6F_P_3,
@@ -2011,20 +2112,20 @@ enum
   EVEX_W_0F7F_P_3,
   EVEX_W_0FC2_P_1,
   EVEX_W_0FC2_P_3,
-  EVEX_W_0FD2_P_2,
-  EVEX_W_0FD3_P_2,
-  EVEX_W_0FD4_P_2,
+  EVEX_W_0FD2,
+  EVEX_W_0FD3,
+  EVEX_W_0FD4,
   EVEX_W_0FD6_P_2,
   EVEX_W_0FE6_P_1,
   EVEX_W_0FE6_P_2,
   EVEX_W_0FE6_P_3,
   EVEX_W_0FE7_P_2,
-  EVEX_W_0FF2_P_2,
-  EVEX_W_0FF3_P_2,
-  EVEX_W_0FF4_P_2,
-  EVEX_W_0FFA_P_2,
-  EVEX_W_0FFB_P_2,
-  EVEX_W_0FFE_P_2,
+  EVEX_W_0FF2,
+  EVEX_W_0FF3,
+  EVEX_W_0FF4,
+  EVEX_W_0FFA,
+  EVEX_W_0FFB,
+  EVEX_W_0FFE,
   EVEX_W_0F380D_P_2,
   EVEX_W_0F3810_P_1,
   EVEX_W_0F3810_P_2,
@@ -2048,15 +2149,11 @@ enum
   EVEX_W_0F3824_P_1,
   EVEX_W_0F3825_P_1,
   EVEX_W_0F3825_P_2,
-  EVEX_W_0F3826_P_1,
-  EVEX_W_0F3826_P_2,
-  EVEX_W_0F3828_P_1,
   EVEX_W_0F3828_P_2,
-  EVEX_W_0F3829_P_1,
   EVEX_W_0F3829_P_2,
   EVEX_W_0F382A_P_1,
   EVEX_W_0F382A_P_2,
-  EVEX_W_0F382B_P_2,
+  EVEX_W_0F382B,
   EVEX_W_0F3830_P_1,
   EVEX_W_0F3831_P_1,
   EVEX_W_0F3832_P_1,
@@ -2065,32 +2162,18 @@ enum
   EVEX_W_0F3835_P_1,
   EVEX_W_0F3835_P_2,
   EVEX_W_0F3837_P_2,
-  EVEX_W_0F3838_P_1,
-  EVEX_W_0F3839_P_1,
   EVEX_W_0F383A_P_1,
-  EVEX_W_0F3840_P_2,
   EVEX_W_0F3852_P_1,
-  EVEX_W_0F3854_P_2,
-  EVEX_W_0F3855_P_2,
   EVEX_W_0F3859_P_2,
   EVEX_W_0F385A_P_2,
   EVEX_W_0F385B_P_2,
-  EVEX_W_0F3862_P_2,
-  EVEX_W_0F3863_P_2,
-  EVEX_W_0F3866_P_2,
-  EVEX_W_0F3868_P_3,
   EVEX_W_0F3870_P_2,
-  EVEX_W_0F3871_P_2,
   EVEX_W_0F3872_P_1,
   EVEX_W_0F3872_P_2,
   EVEX_W_0F3872_P_3,
-  EVEX_W_0F3873_P_2,
-  EVEX_W_0F3875_P_2,
   EVEX_W_0F387A_P_2,
   EVEX_W_0F387B_P_2,
-  EVEX_W_0F387D_P_2,
   EVEX_W_0F3883_P_2,
-  EVEX_W_0F388D_P_2,
   EVEX_W_0F3891_P_2,
   EVEX_W_0F3893_P_2,
   EVEX_W_0F38A1_P_2,
@@ -2117,20 +2200,10 @@ enum
   EVEX_W_0F3A39_P_2,
   EVEX_W_0F3A3A_P_2,
   EVEX_W_0F3A3B_P_2,
-  EVEX_W_0F3A3E_P_2,
-  EVEX_W_0F3A3F_P_2,
   EVEX_W_0F3A42_P_2,
   EVEX_W_0F3A43_P_2,
-  EVEX_W_0F3A50_P_2,
-  EVEX_W_0F3A51_P_2,
-  EVEX_W_0F3A56_P_2,
-  EVEX_W_0F3A57_P_2,
-  EVEX_W_0F3A66_P_2,
-  EVEX_W_0F3A67_P_2,
   EVEX_W_0F3A70_P_2,
-  EVEX_W_0F3A71_P_2,
   EVEX_W_0F3A72_P_2,
-  EVEX_W_0F3A73_P_2,
 };
 
 typedef void (*op_rtn) (int bytemode, int sizeflag);
@@ -2195,13 +2268,14 @@ struct dis386 {
    "XZ" => print 'x', 'y', or 'z' if suffix_always is true or no
           register operands and no broadcast.
    "XW" => print 's', 'd' depending on the VEX.W bit (for FMA)
-   "LQ" => print 'l' ('d' in Intel mode) or 'q' for memory
-          operand or no operand at all in 64bit mode, or if suffix_always
+   "LQ" => print 'l' ('d' in Intel mode) or 'q' for memory operand, cond
+          being false, or no operand at all in 64bit mode, or if suffix_always
           is true.
    "LB" => print "abs" in 64bit mode and behave as 'B' otherwise
    "LS" => print "abs" in 64bit mode and behave as 'S' otherwise
    "LV" => print "abs" for 64bit operand and behave as 'S' otherwise
-   "LW" => print 'd', 'q' depending on the VEX.W bit
+   "DQ" => print 'd' or 'q' depending on the VEX.W bit
+   "BW" => print 'b' or 'w' depending on the EVEX.W bit
    "LP" => print 'w' or 'l' ('d' in Intel mode) if instruction has
           an operand size prefix, or suffix_always is true.  print
           'q' if rex prefix is present.
@@ -2894,8 +2968,6 @@ static struct
   }
 vex;
 static unsigned char need_vex;
-static unsigned char need_vex_reg;
-static unsigned char vex_w_done;
 
 struct op
   {
@@ -3059,6 +3131,16 @@ static const char *att_names_zmm[] = {
   "%zmm28", "%zmm29", "%zmm30", "%zmm31"
 };
 
+static const char **names_tmm;
+static const char *intel_names_tmm[] = {
+  "tmm0", "tmm1", "tmm2", "tmm3",
+  "tmm4", "tmm5", "tmm6", "tmm7"
+};
+static const char *att_names_tmm[] = {
+  "%tmm0", "%tmm1", "%tmm2", "%tmm3",
+  "%tmm4", "%tmm5", "%tmm6", "%tmm7"
+};
+
 static const char **names_mask;
 static const char *intel_names_mask[] = {
   "k0", "k1", "k2", "k3", "k4", "k5", "k6", "k7"
@@ -3427,6 +3509,10 @@ static const struct dis386 reg_table[][8] = {
     { MOD_TABLE (MOD_VEX_0FAE_REG_2) },
     { MOD_TABLE (MOD_VEX_0FAE_REG_3) },
   },
+  /* REG_VEX_0F3849_X86_64_P_0_W_0_M_1 */
+  {
+    { RM_TABLE (RM_VEX_0F3849_X86_64_P_0_W_0_M_1_R_0) },
+  },
   /* REG_VEX_0F38F3 */
   {
     { Bad_Opcode },
@@ -3434,36 +3520,36 @@ static const struct dis386 reg_table[][8] = {
     { PREFIX_TABLE (PREFIX_VEX_0F38F3_REG_2) },
     { PREFIX_TABLE (PREFIX_VEX_0F38F3_REG_3) },
   },
-  /* REG_XOP_LWPCB */
-  {
-    { "llwpcb", { { OP_LWPCB_E, 0 } }, 0 },
-    { "slwpcb",        { { OP_LWPCB_E, 0 } }, 0 },
-  },
-  /* REG_XOP_LWP */
-  {
-    { "lwpins", { { OP_LWP_E, 0 }, Ed, Id }, 0 },
-    { "lwpval",        { { OP_LWP_E, 0 }, Ed, Id }, 0 },
-  },
-  /* REG_XOP_TBM_01 */
+  /* REG_0FXOP_09_01_L_0 */
   {
     { Bad_Opcode },
-    { "blcfill",       { { OP_LWP_E, 0 }, Edq }, 0 },
-    { "blsfill",       { { OP_LWP_E, 0 }, Edq }, 0 },
-    { "blcs",  { { OP_LWP_E, 0 }, Edq }, 0 },
-    { "tzmsk", { { OP_LWP_E, 0 }, Edq }, 0 },
-    { "blcic", { { OP_LWP_E, 0 }, Edq }, 0 },
-    { "blsic", { { OP_LWP_E, 0 }, Edq }, 0 },
-    { "t1mskc",        { { OP_LWP_E, 0 }, Edq }, 0 },
+    { "blcfill",       { VexGdq, Edq }, 0 },
+    { "blsfill",       { VexGdq, Edq }, 0 },
+    { "blcs",  { VexGdq, Edq }, 0 },
+    { "tzmsk", { VexGdq, Edq }, 0 },
+    { "blcic", { VexGdq, Edq }, 0 },
+    { "blsic", { VexGdq, Edq }, 0 },
+    { "t1mskc",        { VexGdq, Edq }, 0 },
   },
-  /* REG_XOP_TBM_02 */
+  /* REG_0FXOP_09_02_L_0 */
   {
     { Bad_Opcode },
-    { "blcmsk",        { { OP_LWP_E, 0 }, Edq }, 0 },
+    { "blcmsk",        { VexGdq, Edq }, 0 },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
-    { "blci",  { { OP_LWP_E, 0 }, Edq }, 0 },
+    { "blci",  { VexGdq, Edq }, 0 },
+  },
+  /* REG_0FXOP_09_12_M_1_L_0 */
+  {
+    { "llwpcb",        { Edq }, 0 },
+    { "slwpcb",        { Edq }, 0 },
+  },
+  /* REG_0FXOP_0A_12_L_0 */
+  {
+    { "lwpins",        { VexGdq, Ed, Id }, 0 },
+    { "lwpval",        { VexGdq, Ed, Id }, 0 },
   },
 
 #include "i386-dis-evex-reg.h"
@@ -3597,9 +3683,9 @@ static const struct dis386 prefix_table[][4] = {
   /* PREFIX_0F2A */
   {
     { "cvtpi2ps", { XM, EMCq }, PREFIX_OPCODE },
-    { "cvtsi2ss%LQ", { XM, Edq }, PREFIX_OPCODE },
+    { "cvtsi2ss{%LQ|}", { XM, Edq }, PREFIX_OPCODE },
     { "cvtpi2pd", { XM, EMCq }, PREFIX_OPCODE },
-    { "cvtsi2sd%LQ", { XM, Edq }, 0 },
+    { "cvtsi2sd{%LQ|}", { XM, Edq }, 0 },
   },
 
   /* PREFIX_0F2B */
@@ -3860,13 +3946,13 @@ static const struct dis386 prefix_table[][4] = {
   /* PREFIX_0FAE_REG_4_MOD_0 */
   {
     { "xsave", { FXSAVE }, 0 },
-    { "ptwrite%LQ", { Edq }, 0 },
+    { "ptwrite{%LQ|}", { Edq }, 0 },
   },
 
   /* PREFIX_0FAE_REG_4_MOD_3 */
   {
     { Bad_Opcode },
-    { "ptwrite%LQ", { Edq }, 0 },
+    { "ptwrite{%LQ|}", { Edq }, 0 },
   },
 
   /* PREFIX_0FAE_REG_5_MOD_0 */
@@ -4314,18 +4400,18 @@ static const struct dis386 prefix_table[][4] = {
 
   /* PREFIX_0F38F0 */
   {
-    { "movbeS",        { Gv, { MOVBE_Fixup, v_mode } }, PREFIX_OPCODE },
+    { "movbeS",        { Gv, Mv }, PREFIX_OPCODE },
     { Bad_Opcode },
-    { "movbeS",        { Gv, { MOVBE_Fixup, v_mode } }, PREFIX_OPCODE },
-    { "crc32", { Gdq, { CRC32_Fixup, b_mode } }, PREFIX_OPCODE },
+    { "movbeS",        { Gv, Mv }, PREFIX_OPCODE },
+    { "crc32A",        { Gdq, Eb }, PREFIX_OPCODE },
   },
 
   /* PREFIX_0F38F1 */
   {
-    { "movbeS",        { { MOVBE_Fixup, v_mode }, Gv }, PREFIX_OPCODE },
+    { "movbeS",        { Mv, Gv }, PREFIX_OPCODE },
     { Bad_Opcode },
-    { "movbeS",        { { MOVBE_Fixup, v_mode }, Gv }, PREFIX_OPCODE },
-    { "crc32", { Gdq, { CRC32_Fixup, v_mode } }, PREFIX_OPCODE },
+    { "movbeS",        { Mv, Gv }, PREFIX_OPCODE },
+    { "crc32Q",        { Gdq, Ev }, PREFIX_OPCODE },
   },
 
   /* PREFIX_0F38F5 */
@@ -4486,14 +4572,14 @@ static const struct dis386 prefix_table[][4] = {
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "pcmpestrm", { XM, { PCMPESTR_Fixup, x_mode }, Ib }, PREFIX_OPCODE },
+    { "pcmpestrm!%LQ", { XM, EXx, Ib }, PREFIX_OPCODE },
   },
 
   /* PREFIX_0F3A61 */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "pcmpestri", { XM, { PCMPESTR_Fixup, x_mode }, Ib }, PREFIX_OPCODE },
+    { "pcmpestri!%LQ", { XM, EXx, Ib }, PREFIX_OPCODE },
   },
 
   /* PREFIX_0F3A62 */
@@ -4539,17 +4625,17 @@ static const struct dis386 prefix_table[][4] = {
   /* PREFIX_VEX_0F10 */
   {
     { "vmovups",       { XM, EXx }, 0 },
-    { "vmovss",                { XMVexScalar, VexScalar, EXxmm_md }, 0 },
+    { "vmovss",                { XMScalar, VexScalarR, EXxmm_md }, 0 },
     { "vmovupd",       { XM, EXx }, 0 },
-    { "vmovsd",                { XMVexScalar, VexScalar, EXxmm_mq }, 0 },
+    { "vmovsd",                { XMScalar, VexScalarR, EXxmm_mq }, 0 },
   },
 
   /* PREFIX_VEX_0F11 */
   {
     { "vmovups",       { EXxS, XM }, 0 },
-    { "vmovss",                { EXdVexScalarS, VexScalar, XMScalar }, 0 },
+    { "vmovss",                { EXdS, VexScalarR, XMScalar }, 0 },
     { "vmovupd",       { EXxS, XM }, 0 },
-    { "vmovsd",                { EXqVexScalarS, VexScalar, XMScalar }, 0 },
+    { "vmovsd",                { EXqS, VexScalarR, XMScalar }, 0 },
   },
 
   /* PREFIX_VEX_0F12 */
@@ -4570,9 +4656,9 @@ static const struct dis386 prefix_table[][4] = {
   /* PREFIX_VEX_0F2A */
   {
     { Bad_Opcode },
-    { "vcvtsi2ss%LQ",  { XMScalar, VexScalar, Edq }, 0 },
+    { "vcvtsi2ss{%LQ|}",       { XMScalar, VexScalar, Edq }, 0 },
     { Bad_Opcode },
-    { "vcvtsi2sd%LQ",  { XMScalar, VexScalar, Edq }, 0 },
+    { "vcvtsi2sd{%LQ|}",       { XMScalar, VexScalar, Edq }, 0 },
   },
 
   /* PREFIX_VEX_0F2C */
@@ -5036,10 +5122,10 @@ static const struct dis386 prefix_table[][4] = {
 
   /* PREFIX_VEX_0FC2 */
   {
-    { "vcmpps",                { XM, Vex, EXx, VCMP }, 0 },
-    { "vcmpss",                { XMScalar, VexScalar, EXxmm_md, VCMP }, 0 },
-    { "vcmppd",                { XM, Vex, EXx, VCMP }, 0 },
-    { "vcmpsd",                { XMScalar, VexScalar, EXxmm_mq, VCMP }, 0 },
+    { "vcmpps",                { XM, Vex, EXx, CMP }, 0 },
+    { "vcmpss",                { XMScalar, VexScalar, EXxmm_md, CMP }, 0 },
+    { "vcmppd",                { XM, Vex, EXx, CMP }, 0 },
+    { "vcmpsd",                { XMScalar, VexScalar, EXxmm_mq, CMP }, 0 },
   },
 
   /* PREFIX_VEX_0FC4 */
@@ -5791,7 +5877,7 @@ static const struct dis386 prefix_table[][4] = {
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vpsrlv%LW", { XM, Vex, EXx }, 0 },
+    { "vpsrlv%DQ", { XM, Vex, EXx }, 0 },
   },
 
   /* PREFIX_VEX_0F3846 */
@@ -5805,7 +5891,23 @@ static const struct dis386 prefix_table[][4] = {
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vpsllv%LW", { XM, Vex, EXx }, 0 },
+    { "vpsllv%DQ", { XM, Vex, EXx }, 0 },
+  },
+
+  /* PREFIX_VEX_0F3849_X86_64 */
+  {
+    { VEX_W_TABLE (VEX_W_0F3849_X86_64_P_0) },
+    { Bad_Opcode },
+    { VEX_W_TABLE (VEX_W_0F3849_X86_64_P_2) },
+    { VEX_W_TABLE (VEX_W_0F3849_X86_64_P_3) },
+  },
+
+  /* PREFIX_VEX_0F384B_X86_64 */
+  {
+    { Bad_Opcode },
+    { VEX_W_TABLE (VEX_W_0F384B_X86_64_P_1) },
+    { VEX_W_TABLE (VEX_W_0F384B_X86_64_P_2) },
+    { VEX_W_TABLE (VEX_W_0F384B_X86_64_P_3) },
   },
 
   /* PREFIX_VEX_0F3858 */
@@ -5829,6 +5931,21 @@ static const struct dis386 prefix_table[][4] = {
     { MOD_TABLE (MOD_VEX_0F385A_PREFIX_2) },
   },
 
+  /* PREFIX_VEX_0F385C_X86_64 */
+  {
+    { Bad_Opcode },
+    { VEX_W_TABLE (VEX_W_0F385C_X86_64_P_1) },
+    { Bad_Opcode },
+  },
+
+  /* PREFIX_VEX_0F385E_X86_64 */
+  {
+    { VEX_W_TABLE (VEX_W_0F385E_X86_64_P_0) },
+    { VEX_W_TABLE (VEX_W_0F385E_X86_64_P_1) },
+    { VEX_W_TABLE (VEX_W_0F385E_X86_64_P_2) },
+    { VEX_W_TABLE (VEX_W_0F385E_X86_64_P_3) },
+  },
+
   /* PREFIX_VEX_0F3878 */
   {
     { Bad_Opcode },
@@ -5861,14 +5978,14 @@ static const struct dis386 prefix_table[][4] = {
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vpgatherd%LW", { XM, MVexVSIBDWpX, Vex }, 0 },
+    { "vpgatherd%DQ", { XM, MVexVSIBDWpX, Vex }, 0 },
   },
 
   /* PREFIX_VEX_0F3891 */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vpgatherq%LW", { XMGatherQ, MVexVSIBQWpX, VexGatherQ }, 0 },
+    { "vpgatherq%DQ", { XMGatherQ, MVexVSIBQWpX, VexGatherQ }, 0 },
   },
 
   /* PREFIX_VEX_0F3892 */
@@ -6431,14 +6548,14 @@ static const struct dis386 prefix_table[][4] = {
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { VEX_W_TABLE (VEX_W_0F3A48_P_2) },
+    { "vpermil2ps",    { XM, Vex, EXx, XMVexI4, VexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A49 */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { VEX_W_TABLE (VEX_W_0F3A49_P_2) },
+    { "vpermil2pd",    { XM, Vex, EXx, XMVexI4, VexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A4A */
@@ -6466,28 +6583,28 @@ static const struct dis386 prefix_table[][4] = {
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfmaddsubps", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfmaddsubps", { XM, Vex, EXx, XMVexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A5D */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfmaddsubpd", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfmaddsubpd", { XM, Vex, EXx, XMVexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A5E */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfmsubaddps", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfmsubaddps", { XM, Vex, EXx, XMVexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A5F */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfmsubaddpd", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfmsubaddpd", { XM, Vex, EXx, XMVexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A60 */
@@ -6523,91 +6640,91 @@ static const struct dis386 prefix_table[][4] = {
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfmaddps", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfmaddps", { XM, Vex, EXx, XMVexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A69 */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfmaddpd", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfmaddpd", { XM, Vex, EXx, XMVexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A6A */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { VEX_LEN_TABLE (VEX_LEN_0F3A6A_P_2) },
+    { "vfmaddss",      { XMScalar, VexScalar, EXxmm_md, XMVexScalarI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A6B */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { VEX_LEN_TABLE (VEX_LEN_0F3A6B_P_2) },
+    { "vfmaddsd",      { XMScalar, VexScalar, EXxmm_mq, XMVexScalarI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A6C */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfmsubps", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfmsubps", { XM, Vex, EXx, XMVexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A6D */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfmsubpd", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfmsubpd", { XM, Vex, EXx, XMVexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A6E */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { VEX_LEN_TABLE (VEX_LEN_0F3A6E_P_2) },
+    { "vfmsubss",      { XMScalar, VexScalar, EXxmm_md, XMVexScalarI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A6F */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { VEX_LEN_TABLE (VEX_LEN_0F3A6F_P_2) },
+    { "vfmsubsd",      { XMScalar, VexScalar, EXxmm_mq, XMVexScalarI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A78 */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfnmaddps", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfnmaddps", { XM, Vex, EXx, XMVexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A79 */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfnmaddpd", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfnmaddpd", { XM, Vex, EXx, XMVexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A7A */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { VEX_LEN_TABLE (VEX_LEN_0F3A7A_P_2) },
+    { "vfnmaddss",     { XMScalar, VexScalar, EXxmm_md, XMVexScalarI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A7B */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { VEX_LEN_TABLE (VEX_LEN_0F3A7B_P_2) },
+    { "vfnmaddsd",     { XMScalar, VexScalar, EXxmm_mq, XMVexScalarI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A7C */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfnmsubps", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfnmsubps", { XM, Vex, EXx, XMVexI4 }, 0 },
     { Bad_Opcode },
   },
 
@@ -6615,21 +6732,21 @@ static const struct dis386 prefix_table[][4] = {
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vfnmsubpd", { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vfnmsubpd", { XM, Vex, EXx, XMVexI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A7E */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { VEX_LEN_TABLE (VEX_LEN_0F3A7E_P_2) },
+    { "vfnmsubss",     { XMScalar, VexScalar, EXxmm_md, XMVexScalarI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3A7F */
   {
     { Bad_Opcode },
     { Bad_Opcode },
-    { VEX_LEN_TABLE (VEX_LEN_0F3A7F_P_2) },
+    { "vfnmsubsd",     { XMScalar, VexScalar, EXxmm_mq, XMVexScalarI4 }, 0 },
   },
 
   /* PREFIX_VEX_0F3ACE */
@@ -6844,6 +6961,30 @@ static const struct dis386 x86_64_table[][2] = {
     { "lidt{Q|Q}", { M }, 0 },
     { "lidt", { M }, 0 },
   },
+
+  /* X86_64_VEX_0F3849 */
+  {
+    { Bad_Opcode },
+    { PREFIX_TABLE (PREFIX_VEX_0F3849_X86_64) },
+  },
+
+  /* X86_64_VEX_0F384B */
+  {
+    { Bad_Opcode },
+    { PREFIX_TABLE (PREFIX_VEX_0F384B_X86_64) },
+  },
+
+  /* X86_64_VEX_0F385C */
+  {
+    { Bad_Opcode },
+    { PREFIX_TABLE (PREFIX_VEX_0F385C_X86_64) },
+  },
+
+  /* X86_64_VEX_0F385E */
+  {
+    { Bad_Opcode },
+    { PREFIX_TABLE (PREFIX_VEX_0F385E_X86_64) },
+  },
 };
 
 static const struct dis386 three_byte_table[][256] = {
@@ -7585,9 +7726,9 @@ static const struct dis386 xop_table[][256] = {
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vpmacssww",     { XMVexW, Vex, EXVexW, EXVexW }, 0 },
-    { "vpmacsswd",     { XMVexW, Vex, EXVexW, EXVexW }, 0 },
-    { "vpmacssdql",    { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_85) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_86) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_87) },
     /* 88 */
     { Bad_Opcode },
     { Bad_Opcode },
@@ -7595,17 +7736,17 @@ static const struct dis386 xop_table[][256] = {
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vpmacssdd",     { XMVexW, Vex, EXVexW, EXVexW }, 0 },
-    { "vpmacssdqh",    { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_8E) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_8F) },
     /* 90 */
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vpmacsww",      { XMVexW, Vex, EXVexW, EXVexW }, 0 },
-    { "vpmacswd",      { XMVexW, Vex, EXVexW, EXVexW }, 0 },
-    { "vpmacsdql",     { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_95) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_96) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_97) },
     /* 98 */
     { Bad_Opcode },
     { Bad_Opcode },
@@ -7613,16 +7754,16 @@ static const struct dis386 xop_table[][256] = {
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vpmacsdd",      { XMVexW, Vex, EXVexW, EXVexW }, 0 },
-    { "vpmacsdqh",     { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_9E) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_9F) },
     /* a0 */
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vpcmov",        { XMVexW, Vex, EXVexW, EXVexW }, 0 },
-    { "vpperm",        { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { "vpcmov",        { XM, Vex, EXx, XMVexI4 }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_A3) },
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vpmadcsswd",    { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_A6) },
     { Bad_Opcode },
     /* a8 */
     { Bad_Opcode },
@@ -7640,7 +7781,7 @@ static const struct dis386 xop_table[][256] = {
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vpmadcswd",     { XMVexW, Vex, EXVexW, EXVexW }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_B6) },
     { Bad_Opcode },
     /* b8 */
     { Bad_Opcode },
@@ -7652,10 +7793,10 @@ static const struct dis386 xop_table[][256] = {
     { Bad_Opcode },
     { Bad_Opcode },
     /* c0 */
-    { "vprotb",        { XM, Vex_2src_1, Ib }, 0 },
-    { "vprotw",        { XM, Vex_2src_1, Ib }, 0 },
-    { "vprotd",        { XM, Vex_2src_1, Ib }, 0 },
-    { "vprotq",        { XM, Vex_2src_1, Ib }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_C0) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_C1) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_C2) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_08_C3) },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
@@ -7728,8 +7869,8 @@ static const struct dis386 xop_table[][256] = {
   {
     /* 00 */
     { Bad_Opcode },
-    { REG_TABLE (REG_XOP_TBM_01) },
-    { REG_TABLE (REG_XOP_TBM_02) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_01) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_02) },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
@@ -7747,7 +7888,7 @@ static const struct dis386 xop_table[][256] = {
     /* 10 */
     { Bad_Opcode },
     { Bad_Opcode },
-    { REG_TABLE (REG_XOP_LWPCB) },
+    { MOD_TABLE (MOD_VEX_0FXOP_09_12) },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
@@ -7871,10 +8012,10 @@ static const struct dis386 xop_table[][256] = {
     { Bad_Opcode },
     { Bad_Opcode },
     /* 80 */
-    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_80) },
-    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_81) },
-    { "vfrczss",       { XM, EXd }, 0 },
-    { "vfrczsd",       { XM, EXq }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_09_80) },
+    { VEX_W_TABLE (VEX_W_0FXOP_09_81) },
+    { VEX_W_TABLE (VEX_W_0FXOP_09_82) },
+    { VEX_W_TABLE (VEX_W_0FXOP_09_83) },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
@@ -7889,19 +8030,19 @@ static const struct dis386 xop_table[][256] = {
     { Bad_Opcode },
     { Bad_Opcode },
     /* 90 */
-    { "vprotb",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
-    { "vprotw",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
-    { "vprotd",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
-    { "vprotq",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
-    { "vpshlb",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
-    { "vpshlw",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
-    { "vpshld",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
-    { "vpshlq",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_90) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_91) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_92) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_93) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_94) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_95) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_96) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_97) },
     /* 98 */
-    { "vpshab",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
-    { "vpshaw",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
-    { "vpshad",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
-    { "vpshaq",                { XM, Vex_2src_1, Vex_2src_2 }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_98) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_99) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_9A) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_9B) },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
@@ -7944,45 +8085,45 @@ static const struct dis386 xop_table[][256] = {
     { Bad_Opcode },
     /* c0 */
     { Bad_Opcode },
-    { "vphaddbw",      { XM, EXxmm }, 0 },
-    { "vphaddbd",      { XM, EXxmm }, 0 },
-    { "vphaddbq",      { XM, EXxmm }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_C1) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_C2) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_C3) },
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vphaddwd",      { XM, EXxmm }, 0 },
-    { "vphaddwq",      { XM, EXxmm }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_C6) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_C7) },
     /* c8 */
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vphadddq",      { XM, EXxmm }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_CB) },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
     /* d0 */
     { Bad_Opcode },
-    { "vphaddubw",     { XM, EXxmm }, 0 },
-    { "vphaddubd",     { XM, EXxmm }, 0 },
-    { "vphaddubq",     { XM, EXxmm }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_D1) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_D2) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_D3) },
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vphadduwd",     { XM, EXxmm }, 0 },
-    { "vphadduwq",     { XM, EXxmm }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_D6) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_D7) },
     /* d8 */
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
-    { "vphaddudq",     { XM, EXxmm }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_DB) },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
     /* e0 */
     { Bad_Opcode },
-    { "vphsubbw",      { XM, EXxmm }, 0 },
-    { "vphsubwd",      { XM, EXxmm }, 0 },
-    { "vphsubdq",      { XM, EXxmm }, 0 },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_E1) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_E2) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_E3) },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
@@ -8038,7 +8179,7 @@ static const struct dis386 xop_table[][256] = {
     /* 10 */
     { "bextrS",        { Gdq, Edq, Id }, 0 },
     { Bad_Opcode },
-    { REG_TABLE (REG_XOP_LWP) },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_0A_12) },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
@@ -8685,9 +8826,9 @@ static const struct dis386 vex_table[][256] = {
     { PREFIX_TABLE (PREFIX_VEX_0F3847) },
     /* 48 */
     { Bad_Opcode },
+    { X86_64_TABLE (X86_64_VEX_0F3849) },
     { Bad_Opcode },
-    { Bad_Opcode },
-    { Bad_Opcode },
+    { X86_64_TABLE (X86_64_VEX_0F384B) },
     { Bad_Opcode },
     { Bad_Opcode },
     { Bad_Opcode },
@@ -8706,9 +8847,9 @@ static const struct dis386 vex_table[][256] = {
     { PREFIX_TABLE (PREFIX_VEX_0F3859) },
     { PREFIX_TABLE (PREFIX_VEX_0F385A) },
     { Bad_Opcode },
+    { X86_64_TABLE (X86_64_VEX_0F385C) },
     { Bad_Opcode },
-    { Bad_Opcode },
-    { Bad_Opcode },
+    { X86_64_TABLE (X86_64_VEX_0F385E) },
     { Bad_Opcode },
     /* 60 */
     { Bad_Opcode },
@@ -9189,12 +9330,12 @@ static const struct dis386 vex_table[][256] = {
 static const struct dis386 vex_len_table[][2] = {
   /* VEX_LEN_0F12_P_0_M_0 / VEX_LEN_0F12_P_2_M_0 */
   {
-    { "vmovlpX",       { XM, Vex128, EXq }, 0 },
+    { "vmovlpX",       { XM, Vex, EXq }, 0 },
   },
 
   /* VEX_LEN_0F12_P_0_M_1 */
   {
-    { "vmovhlps",      { XM, Vex128, EXq }, 0 },
+    { "vmovhlps",      { XM, Vex, EXq }, 0 },
   },
 
   /* VEX_LEN_0F13_M_0 */
@@ -9204,12 +9345,12 @@ static const struct dis386 vex_len_table[][2] = {
 
   /* VEX_LEN_0F16_P_0_M_0 / VEX_LEN_0F16_P_2_M_0 */
   {
-    { "vmovhpX",       { XM, Vex128, EXq }, 0 },
+    { "vmovhpX",       { XM, Vex, EXq }, 0 },
   },
 
   /* VEX_LEN_0F16_P_0_M_1 */
   {
-    { "vmovlhps",      { XM, Vex128, EXq }, 0 },
+    { "vmovlhps",      { XM, Vex, EXq }, 0 },
   },
 
   /* VEX_LEN_0F17_M_0 */
@@ -9399,7 +9540,7 @@ static const struct dis386 vex_len_table[][2] = {
 
   /* VEX_LEN_0FC4_P_2 */
   {
-    { "vpinsrw",       { XM, Vex128, Edqw, Ib }, 0 },
+    { "vpinsrw",       { XM, Vex, Edqw, Ib }, 0 },
   },
 
   /* VEX_LEN_0FC5_P_2 */
@@ -9409,7 +9550,7 @@ static const struct dis386 vex_len_table[][2] = {
 
   /* VEX_LEN_0FD6_P_2 */
   {
-    { "vmovq",         { EXqVexScalarS, XMScalar }, 0 },
+    { "vmovq",         { EXqS, XMScalar }, 0 },
   },
 
   /* VEX_LEN_0FF7_P_2 */
@@ -9432,7 +9573,7 @@ static const struct dis386 vex_len_table[][2] = {
   /* VEX_LEN_0F381A_P_2_M_0 */
   {
     { Bad_Opcode },
-    { VEX_W_TABLE (VEX_W_0F381A_P_2_M_0) },
+    { VEX_W_TABLE (VEX_W_0F381A_P_2_M_0_L_0) },
   },
 
   /* VEX_LEN_0F3836_P_2 */
@@ -9446,10 +9587,69 @@ static const struct dis386 vex_len_table[][2] = {
     { "vphminposuw",   { XM, EXx }, 0 },
   },
 
+   /* VEX_LEN_0F3849_X86_64_P_0_W_0_M_0 */
+  {
+    { "ldtilecfg", { M }, 0 },
+  },
+
+  /* VEX_LEN_0F3849_X86_64_P_0_W_0_M_1_REG_0_RM_0 */
+  {
+    { "tilerelease", { Skip_MODRM }, 0 },
+  },
+
+  /* VEX_LEN_0F3849_X86_64_P_2_W_0_M_0 */
+  {
+    { "sttilecfg", { M }, 0 },
+  },
+
+  /* VEX_LEN_0F3849_X86_64_P_3_W_0_M_0 */
+  {
+    { "tilezero", { TMM, Skip_MODRM }, 0 },
+  },
+
+  /* VEX_LEN_0F384B_X86_64_P_1_W_0_M_0 */
+  {
+    { "tilestored", { MVexSIBMEM, TMM }, 0 },
+  },
+  /* VEX_LEN_0F384B_X86_64_P_2_W_0_M_0 */
+  {
+    { "tileloaddt1", { TMM, MVexSIBMEM }, 0 },
+  },
+
+  /* VEX_LEN_0F384B_X86_64_P_3_W_0_M_0 */
+  {
+    { "tileloadd", { TMM, MVexSIBMEM }, 0 },
+  },
+
   /* VEX_LEN_0F385A_P_2_M_0 */
   {
     { Bad_Opcode },
-    { VEX_W_TABLE (VEX_W_0F385A_P_2_M_0) },
+    { VEX_W_TABLE (VEX_W_0F385A_P_2_M_0_L_0) },
+  },
+
+  /* VEX_LEN_0F385C_X86_64_P_1_W_0_M_0 */
+  {
+    { "tdpbf16ps", { TMM, EXtmm, VexTmm }, 0 },
+  },
+
+  /* VEX_LEN_0F385E_X86_64_P_0_W_0_M_0 */
+  {
+    { "tdpbuud", {TMM, EXtmm, VexTmm }, 0 },
+  },
+
+  /* VEX_LEN_0F385E_X86_64_P_1_W_0_M_0 */
+  {
+    { "tdpbsud", {TMM, EXtmm, VexTmm }, 0 },
+  },
+
+  /* VEX_LEN_0F385E_X86_64_P_2_W_0_M_0 */
+  {
+    { "tdpbusd", {TMM, EXtmm, VexTmm }, 0 },
+  },
+
+  /* VEX_LEN_0F385E_X86_64_P_3_W_0_M_0 */
+  {
+    { "tdpbssd", {TMM, EXtmm, VexTmm }, 0 },
   },
 
   /* VEX_LEN_0F38DB_P_2 */
@@ -9532,7 +9732,7 @@ static const struct dis386 vex_len_table[][2] = {
   /* VEX_LEN_0F3A06_P_2 */
   {
     { Bad_Opcode },
-    { VEX_W_TABLE (VEX_W_0F3A06_P_2) },
+    { VEX_W_TABLE (VEX_W_0F3A06_P_2_L_0) },
   },
 
   /* VEX_LEN_0F3A14_P_2 */
@@ -9558,28 +9758,28 @@ static const struct dis386 vex_len_table[][2] = {
   /* VEX_LEN_0F3A18_P_2 */
   {
     { Bad_Opcode },
-    { VEX_W_TABLE (VEX_W_0F3A18_P_2) },
+    { VEX_W_TABLE (VEX_W_0F3A18_P_2_L_0) },
   },
 
   /* VEX_LEN_0F3A19_P_2 */
   {
     { Bad_Opcode },
-    { VEX_W_TABLE (VEX_W_0F3A19_P_2) },
+    { VEX_W_TABLE (VEX_W_0F3A19_P_2_L_0) },
   },
 
   /* VEX_LEN_0F3A20_P_2 */
   {
-    { "vpinsrb",       { XM, Vex128, Edqb, Ib }, 0 },
+    { "vpinsrb",       { XM, Vex, Edqb, Ib }, 0 },
   },
 
   /* VEX_LEN_0F3A21_P_2 */
   {
-    { "vinsertps",     { XM, Vex128, EXd, Ib }, 0 },
+    { "vinsertps",     { XM, Vex, EXd, Ib }, 0 },
   },
 
   /* VEX_LEN_0F3A22_P_2 */
   {
-    { "vpinsrK",       { XM, Vex128, Edq, Ib }, 0 },
+    { "vpinsrK",       { XM, Vex, Edq, Ib }, 0 },
   },
 
   /* VEX_LEN_0F3A30_P_2 */
@@ -9605,34 +9805,34 @@ static const struct dis386 vex_len_table[][2] = {
   /* VEX_LEN_0F3A38_P_2 */
   {
     { Bad_Opcode },
-    { VEX_W_TABLE (VEX_W_0F3A38_P_2) },
+    { VEX_W_TABLE (VEX_W_0F3A38_P_2_L_0) },
   },
 
   /* VEX_LEN_0F3A39_P_2 */
   {
     { Bad_Opcode },
-    { VEX_W_TABLE (VEX_W_0F3A39_P_2) },
+    { VEX_W_TABLE (VEX_W_0F3A39_P_2_L_0) },
   },
 
   /* VEX_LEN_0F3A41_P_2 */
   {
-    { "vdppd",         { XM, Vex128, EXx, Ib }, 0 },
+    { "vdppd",         { XM, Vex, EXx, Ib }, 0 },
   },
 
   /* VEX_LEN_0F3A46_P_2 */
   {
     { Bad_Opcode },
-    { VEX_W_TABLE (VEX_W_0F3A46_P_2) },
+    { VEX_W_TABLE (VEX_W_0F3A46_P_2_L_0) },
   },
 
   /* VEX_LEN_0F3A60_P_2 */
   {
-    { "vpcmpestrm",    { XM, { PCMPESTR_Fixup, x_mode }, Ib }, 0 },
+    { "vpcmpestrm!%LQ",        { XM, EXx, Ib }, 0 },
   },
 
   /* VEX_LEN_0F3A61_P_2 */
   {
-    { "vpcmpestri",    { XM, { PCMPESTR_Fixup, x_mode }, Ib }, 0 },
+    { "vpcmpestri!%LQ",        { XM, EXx, Ib }, 0 },
   },
 
   /* VEX_LEN_0F3A62_P_2 */
@@ -9645,106 +9845,304 @@ static const struct dis386 vex_len_table[][2] = {
     { "vpcmpistri",    { XM, EXx, Ib }, 0 },
   },
 
-  /* VEX_LEN_0F3A6A_P_2 */
+  /* VEX_LEN_0F3ADF_P_2 */
   {
-    { "vfmaddss",      { XMVexW, Vex128, EXdVexW, EXdVexW }, 0 },
+    { "vaeskeygenassist", { XM, EXx, Ib }, 0 },
   },
 
-  /* VEX_LEN_0F3A6B_P_2 */
+  /* VEX_LEN_0F3AF0_P_3 */
   {
-    { "vfmaddsd",      { XMVexW, Vex128, EXqVexW, EXqVexW }, 0 },
+    { "rorxS",         { Gdq, Edq, Ib }, 0 },
   },
 
-  /* VEX_LEN_0F3A6E_P_2 */
+  /* VEX_LEN_0FXOP_08_85 */
   {
-    { "vfmsubss",      { XMVexW, Vex128, EXdVexW, EXdVexW }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_85_L_0) },
   },
 
-  /* VEX_LEN_0F3A6F_P_2 */
+  /* VEX_LEN_0FXOP_08_86 */
   {
-    { "vfmsubsd",      { XMVexW, Vex128, EXqVexW, EXqVexW }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_86_L_0) },
   },
 
-  /* VEX_LEN_0F3A7A_P_2 */
+  /* VEX_LEN_0FXOP_08_87 */
   {
-    { "vfnmaddss",     { XMVexW, Vex128, EXdVexW, EXdVexW }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_87_L_0) },
   },
 
-  /* VEX_LEN_0F3A7B_P_2 */
+  /* VEX_LEN_0FXOP_08_8E */
   {
-    { "vfnmaddsd",     { XMVexW, Vex128, EXqVexW, EXqVexW }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_8E_L_0) },
   },
 
-  /* VEX_LEN_0F3A7E_P_2 */
+  /* VEX_LEN_0FXOP_08_8F */
   {
-    { "vfnmsubss",     { XMVexW, Vex128, EXdVexW, EXdVexW }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_8F_L_0) },
   },
 
-  /* VEX_LEN_0F3A7F_P_2 */
+  /* VEX_LEN_0FXOP_08_95 */
   {
-    { "vfnmsubsd",     { XMVexW, Vex128, EXqVexW, EXqVexW }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_95_L_0) },
   },
 
-  /* VEX_LEN_0F3ADF_P_2 */
+  /* VEX_LEN_0FXOP_08_96 */
   {
-    { "vaeskeygenassist", { XM, EXx, Ib }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_96_L_0) },
   },
 
-  /* VEX_LEN_0F3AF0_P_3 */
+  /* VEX_LEN_0FXOP_08_97 */
   {
-    { "rorxS",         { Gdq, Edq, Ib }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_97_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_08_9E */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_08_9E_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_08_9F */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_08_9F_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_08_A3 */
+  {
+    { "vpperm",        { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_08_A6 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_08_A6_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_08_B6 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_08_B6_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_08_C0 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_08_C0_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_08_C1 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_08_C1_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_08_C2 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_08_C2_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_08_C3 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_08_C3_L_0) },
   },
 
   /* VEX_LEN_0FXOP_08_CC */
   {
-     { "vpcomb",       { XM, Vex128, EXx, VPCOM }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_CC_L_0) },
   },
 
   /* VEX_LEN_0FXOP_08_CD */
   {
-     { "vpcomw",       { XM, Vex128, EXx, VPCOM }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_CD_L_0) },
   },
 
   /* VEX_LEN_0FXOP_08_CE */
   {
-     { "vpcomd",       { XM, Vex128, EXx, VPCOM }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_CE_L_0) },
   },
 
   /* VEX_LEN_0FXOP_08_CF */
   {
-     { "vpcomq",       { XM, Vex128, EXx, VPCOM }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_CF_L_0) },
   },
 
   /* VEX_LEN_0FXOP_08_EC */
   {
-     { "vpcomub",      { XM, Vex128, EXx, VPCOM }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_EC_L_0) },
   },
 
   /* VEX_LEN_0FXOP_08_ED */
   {
-     { "vpcomuw",      { XM, Vex128, EXx, VPCOM }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_ED_L_0) },
   },
 
   /* VEX_LEN_0FXOP_08_EE */
   {
-     { "vpcomud",      { XM, Vex128, EXx, VPCOM }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_EE_L_0) },
   },
 
   /* VEX_LEN_0FXOP_08_EF */
   {
-     { "vpcomuq",      { XM, Vex128, EXx, VPCOM }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_08_EF_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_01 */
+  {
+    { REG_TABLE (REG_0FXOP_09_01_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_02 */
+  {
+    { REG_TABLE (REG_0FXOP_09_02_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_12_M_1 */
+  {
+    { REG_TABLE (REG_0FXOP_09_12_M_1_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_82_W_0 */
+  {
+    { "vfrczss",       { XM, EXd }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_83_W_0 */
+  {
+    { "vfrczsd",       { XM, EXq }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_90 */
+  {
+    { "vprotb",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_91 */
+  {
+    { "vprotw",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_92 */
+  {
+    { "vprotd",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_93 */
+  {
+    { "vprotq",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_94 */
+  {
+    { "vpshlb",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_95 */
+  {
+    { "vpshlw",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_96 */
+  {
+    { "vpshld",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_97 */
+  {
+    { "vpshlq",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_98 */
+  {
+    { "vpshab",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_99 */
+  {
+    { "vpshaw",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_9A */
+  {
+    { "vpshad",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_9B */
+  {
+    { "vpshaq",                { XM, EXx, VexW }, 0 },
+  },
+
+  /* VEX_LEN_0FXOP_09_C1 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_C1_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_C2 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_C2_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_C3 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_C3_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_C6 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_C6_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_C7 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_C7_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_CB */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_CB_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_D1 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_D1_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_D2 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_D2_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_D3 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_D3_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_D6 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_D6_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_D7 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_D7_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_DB */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_DB_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_09_E1 */
+  {
+    { VEX_W_TABLE (VEX_W_0FXOP_09_E1_L_0) },
   },
 
-  /* VEX_LEN_0FXOP_09_80 */
+  /* VEX_LEN_0FXOP_09_E2 */
   {
-    { "vfrczps",       { XM, EXxmm }, 0 },
-    { "vfrczps",       { XM, EXymmq }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_09_E2_L_0) },
   },
 
-  /* VEX_LEN_0FXOP_09_81 */
+  /* VEX_LEN_0FXOP_09_E3 */
   {
-    { "vfrczpd",       { XM, EXxmm }, 0 },
-    { "vfrczpd",       { XM, EXymmq }, 0 },
+    { VEX_W_TABLE (VEX_W_0FXOP_09_E3_L_0) },
+  },
+
+  /* VEX_LEN_0FXOP_0A_12 */
+  {
+    { REG_TABLE (REG_0FXOP_0A_12_L_0) },
   },
 };
 
@@ -9919,7 +10317,7 @@ static const struct dis386 vex_w_table[][2] = {
     { "vbroadcastsd",  { XM, EXxmm_mq }, 0 },
   },
   {
-    /* VEX_W_0F381A_P_2_M_0 */
+    /* VEX_W_0F381A_P_2_M_0_L_0 */
     { "vbroadcastf128",        { XM, Mxmm }, 0 },
   },
   {
@@ -9946,6 +10344,30 @@ static const struct dis386 vex_w_table[][2] = {
     /* VEX_W_0F3846_P_2 */
     { "vpsravd",       { XM, Vex, EXx }, 0 },
   },
+  {
+    /* VEX_W_0F3849_X86_64_P_0 */
+    { MOD_TABLE (MOD_VEX_0F3849_X86_64_P_0_W_0) },
+  },
+  {
+    /* VEX_W_0F3849_X86_64_P_2 */
+    { MOD_TABLE (MOD_VEX_0F3849_X86_64_P_2_W_0) },
+  },
+  {
+    /* VEX_W_0F3849_X86_64_P_3 */
+    { MOD_TABLE (MOD_VEX_0F3849_X86_64_P_3_W_0) },
+  },
+  {
+    /* VEX_W_0F384B_X86_64_P_1 */
+    { MOD_TABLE (MOD_VEX_0F384B_X86_64_P_1_W_0) },
+  },
+  {
+    /* VEX_W_0F384B_X86_64_P_2 */
+    { MOD_TABLE (MOD_VEX_0F384B_X86_64_P_2_W_0) },
+  },
+  {
+    /* VEX_W_0F384B_X86_64_P_3 */
+    { MOD_TABLE (MOD_VEX_0F384B_X86_64_P_3_W_0) },
+  },
   {
     /* VEX_W_0F3858_P_2 */
     { "vpbroadcastd", { XM, EXxmm_md }, 0 },
@@ -9955,25 +10377,45 @@ static const struct dis386 vex_w_table[][2] = {
     { "vpbroadcastq",  { XM, EXxmm_mq }, 0 },
   },
   {
-    /* VEX_W_0F385A_P_2_M_0 */
+    /* VEX_W_0F385A_P_2_M_0_L_0 */
     { "vbroadcasti128", { XM, Mxmm }, 0 },
   },
   {
-    /* VEX_W_0F3878_P_2 */
-    { "vpbroadcastb",  { XM, EXxmm_mb }, 0 },
+    /* VEX_W_0F385C_X86_64_P_1 */
+    { MOD_TABLE (MOD_VEX_0F385C_X86_64_P_1_W_0) },
   },
   {
-    /* VEX_W_0F3879_P_2 */
-    { "vpbroadcastw",  { XM, EXxmm_mw }, 0 },
+    /* VEX_W_0F385E_X86_64_P_0 */
+    { MOD_TABLE (MOD_VEX_0F385E_X86_64_P_0_W_0) },
   },
   {
-    /* VEX_W_0F38CF_P_2 */
-    { "vgf2p8mulb", { XM, Vex, EXx }, 0 },
+    /* VEX_W_0F385E_X86_64_P_1 */
+    { MOD_TABLE (MOD_VEX_0F385E_X86_64_P_1_W_0) },
   },
   {
-    /* VEX_W_0F3A00_P_2 */
-    { Bad_Opcode },
-    { "vpermq",                { XM, EXx, Ib }, 0 },
+    /* VEX_W_0F385E_X86_64_P_2 */
+    { MOD_TABLE (MOD_VEX_0F385E_X86_64_P_2_W_0) },
+  },
+  {
+    /* VEX_W_0F385E_X86_64_P_3 */
+    { MOD_TABLE (MOD_VEX_0F385E_X86_64_P_3_W_0) },
+  },
+  {
+    /* VEX_W_0F3878_P_2 */
+    { "vpbroadcastb",  { XM, EXxmm_mb }, 0 },
+  },
+  {
+    /* VEX_W_0F3879_P_2 */
+    { "vpbroadcastw",  { XM, EXxmm_mw }, 0 },
+  },
+  {
+    /* VEX_W_0F38CF_P_2 */
+    { "vgf2p8mulb", { XM, Vex, EXx }, 0 },
+  },
+  {
+    /* VEX_W_0F3A00_P_2 */
+    { Bad_Opcode },
+    { "vpermq",                { XM, EXx, Ib }, 0 },
   },
   {
     /* VEX_W_0F3A01_P_2 */
@@ -9993,15 +10435,15 @@ static const struct dis386 vex_w_table[][2] = {
     { "vpermilpd",     { XM, EXx, Ib }, 0 },
   },
   {
-    /* VEX_W_0F3A06_P_2 */
-    { "vperm2f128",    { XM, Vex256, EXx, Ib }, 0 },
+    /* VEX_W_0F3A06_P_2_L_0 */
+    { "vperm2f128",    { XM, Vex, EXx, Ib }, 0 },
   },
   {
-    /* VEX_W_0F3A18_P_2 */
-    { "vinsertf128",   { XM, Vex256, EXxmm, Ib }, 0 },
+    /* VEX_W_0F3A18_P_2_L_0 */
+    { "vinsertf128",   { XM, Vex, EXxmm, Ib }, 0 },
   },
   {
-    /* VEX_W_0F3A19_P_2 */
+    /* VEX_W_0F3A19_P_2_L_0 */
     { "vextractf128",  { EXxmm, XM, Ib }, 0 },
   },
   {
@@ -10029,26 +10471,16 @@ static const struct dis386 vex_w_table[][2] = {
     { MOD_TABLE (MOD_VEX_W_1_0F3A33_P_2_LEN_0) },
   },
   {
-    /* VEX_W_0F3A38_P_2 */
-    { "vinserti128",   { XM, Vex256, EXxmm, Ib }, 0 },
+    /* VEX_W_0F3A38_P_2_L_0 */
+    { "vinserti128",   { XM, Vex, EXxmm, Ib }, 0 },
   },
   {
-    /* VEX_W_0F3A39_P_2 */
+    /* VEX_W_0F3A39_P_2_L_0 */
     { "vextracti128",  { EXxmm, XM, Ib }, 0 },
   },
   {
-    /* VEX_W_0F3A46_P_2 */
-    { "vperm2i128",    { XM, Vex256, EXx, Ib }, 0 },
-  },
-  {
-    /* VEX_W_0F3A48_P_2 */
-    { "vpermil2ps",    { XMVexW, Vex, EXVexImmW, EXVexImmW, EXVexImmW }, 0 },
-    { "vpermil2ps",    { XMVexW, Vex, EXVexImmW, EXVexImmW, EXVexImmW }, 0 },
-  },
-  {
-    /* VEX_W_0F3A49_P_2 */
-    { "vpermil2pd",    { XMVexW, Vex, EXVexImmW, EXVexImmW, EXVexImmW }, 0 },
-    { "vpermil2pd",    { XMVexW, Vex, EXVexImmW, EXVexImmW, EXVexImmW }, 0 },
+    /* VEX_W_0F3A46_P_2_L_0 */
+    { "vperm2i128",    { XM, Vex, EXx, Ib }, 0 },
   },
   {
     /* VEX_W_0F3A4A_P_2 */
@@ -10072,6 +10504,178 @@ static const struct dis386 vex_w_table[][2] = {
     { Bad_Opcode },
     { "vgf2p8affineinvqb",  { XM, Vex, EXx, Ib }, 0 },
   },
+  /* VEX_W_0FXOP_08_85_L_0 */
+  {
+    { "vpmacssww",     { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_86_L_0 */
+  {
+    { "vpmacsswd",     { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_87_L_0 */
+  {
+    { "vpmacssdql",    { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_8E_L_0 */
+  {
+    { "vpmacssdd",     { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_8F_L_0 */
+  {
+    { "vpmacssdqh",    { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_95_L_0 */
+  {
+    { "vpmacsww",      { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_96_L_0 */
+  {
+    { "vpmacswd",      { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_97_L_0 */
+  {
+    { "vpmacsdql",     { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_9E_L_0 */
+  {
+    { "vpmacsdd",      { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_9F_L_0 */
+  {
+    { "vpmacsdqh",     { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_A6_L_0 */
+  {
+    { "vpmadcsswd",    { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_B6_L_0 */
+  {
+    { "vpmadcswd",     { XM, Vex, EXx, XMVexI4 }, 0 },
+  },
+  /* VEX_W_0FXOP_08_C0_L_0 */
+  {
+    { "vprotb",        { XM, EXx, Ib }, 0 },
+  },
+  /* VEX_W_0FXOP_08_C1_L_0 */
+  {
+    { "vprotw",        { XM, EXx, Ib }, 0 },
+  },
+  /* VEX_W_0FXOP_08_C2_L_0 */
+  {
+    { "vprotd",        { XM, EXx, Ib }, 0 },
+  },
+  /* VEX_W_0FXOP_08_C3_L_0 */
+  {
+    { "vprotq",        { XM, EXx, Ib }, 0 },
+  },
+  /* VEX_W_0FXOP_08_CC_L_0 */
+  {
+     { "vpcomb",       { XM, Vex, EXx, VPCOM }, 0 },
+  },
+  /* VEX_W_0FXOP_08_CD_L_0 */
+  {
+     { "vpcomw",       { XM, Vex, EXx, VPCOM }, 0 },
+  },
+  /* VEX_W_0FXOP_08_CE_L_0 */
+  {
+     { "vpcomd",       { XM, Vex, EXx, VPCOM }, 0 },
+  },
+  /* VEX_W_0FXOP_08_CF_L_0 */
+  {
+     { "vpcomq",       { XM, Vex, EXx, VPCOM }, 0 },
+  },
+  /* VEX_W_0FXOP_08_EC_L_0 */
+  {
+     { "vpcomub",      { XM, Vex, EXx, VPCOM }, 0 },
+  },
+  /* VEX_W_0FXOP_08_ED_L_0 */
+  {
+     { "vpcomuw",      { XM, Vex, EXx, VPCOM }, 0 },
+  },
+  /* VEX_W_0FXOP_08_EE_L_0 */
+  {
+     { "vpcomud",      { XM, Vex, EXx, VPCOM }, 0 },
+  },
+  /* VEX_W_0FXOP_08_EF_L_0 */
+  {
+     { "vpcomuq",      { XM, Vex, EXx, VPCOM }, 0 },
+  },
+  /* VEX_W_0FXOP_09_80 */
+  {
+    { "vfrczps",       { XM, EXx }, 0 },
+  },
+  /* VEX_W_0FXOP_09_81 */
+  {
+    { "vfrczpd",       { XM, EXx }, 0 },
+  },
+  /* VEX_W_0FXOP_09_82 */
+  {
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_82_W_0) },
+  },
+  /* VEX_W_0FXOP_09_83 */
+  {
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_83_W_0) },
+  },
+  /* VEX_W_0FXOP_09_C1_L_0 */
+  {
+    { "vphaddbw",      { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_C2_L_0 */
+  {
+    { "vphaddbd",      { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_C3_L_0 */
+  {
+    { "vphaddbq",      { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_C6_L_0 */
+  {
+    { "vphaddwd",      { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_C7_L_0 */
+  {
+    { "vphaddwq",      { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_CB_L_0 */
+  {
+    { "vphadddq",      { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_D1_L_0 */
+  {
+    { "vphaddubw",     { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_D2_L_0 */
+  {
+    { "vphaddubd",     { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_D3_L_0 */
+  {
+    { "vphaddubq",     { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_D6_L_0 */
+  {
+    { "vphadduwd",     { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_D7_L_0 */
+  {
+    { "vphadduwq",     { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_DB_L_0 */
+  {
+    { "vphaddudq",     { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_E1_L_0 */
+  {
+    { "vphsubbw",      { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_E2_L_0 */
+  {
+    { "vphsubwd",      { XM, EXxmm }, 0 },
+  },
+  /* VEX_W_0FXOP_09_E3_L_0 */
+  {
+    { "vphsubdq",      { XM, EXxmm }, 0 },
+  },
 
 #include "i386-dis-evex-w.h"
 };
@@ -10388,6 +10992,57 @@ static const struct dis386 mod_table[][2] = {
     /* MOD_0F382A_PREFIX_2 */
     { "movntdqa",      { XM, Mx }, 0 },
   },
+  {
+    /* MOD_VEX_0F3849_X86_64_P_0_W_0 */
+    { VEX_LEN_TABLE (VEX_LEN_0F3849_X86_64_P_0_W_0_M_0) },
+    { REG_TABLE (REG_VEX_0F3849_X86_64_P_0_W_0_M_1) },
+  },
+  {
+    /* MOD_VEX_0F3849_X86_64_P_2_W_0 */
+    { VEX_LEN_TABLE (VEX_LEN_0F3849_X86_64_P_2_W_0_M_0) },
+  },
+  {
+    /* MOD_VEX_0F3849_X86_64_P_3_W_0 */
+    { Bad_Opcode },
+    { VEX_LEN_TABLE (VEX_LEN_0F3849_X86_64_P_3_W_0_M_0) },
+  },
+  {
+    /* MOD_VEX_0F384B_X86_64_P_1_W_0 */
+    { VEX_LEN_TABLE (VEX_LEN_0F384B_X86_64_P_1_W_0_M_0) },
+  },
+  {
+    /* MOD_VEX_0F384B_X86_64_P_2_W_0 */
+    { VEX_LEN_TABLE (VEX_LEN_0F384B_X86_64_P_2_W_0_M_0) },
+  },
+  {
+    /* MOD_VEX_0F384B_X86_64_P_3_W_0 */
+    { VEX_LEN_TABLE (VEX_LEN_0F384B_X86_64_P_3_W_0_M_0) },
+  },
+  {
+    /* MOD_VEX_0F385C_X86_64_P_1_W_0 */
+    { Bad_Opcode },
+    { VEX_LEN_TABLE (VEX_LEN_0F385C_X86_64_P_1_W_0_M_0) },
+  },
+  {
+    /* MOD_VEX_0F385E_X86_64_P_0_W_0 */
+    { Bad_Opcode },
+    { VEX_LEN_TABLE (VEX_LEN_0F385E_X86_64_P_0_W_0_M_0) },
+  },
+  {
+    /* MOD_VEX_0F385E_X86_64_P_1_W_0 */
+    { Bad_Opcode },
+    { VEX_LEN_TABLE (VEX_LEN_0F385E_X86_64_P_1_W_0_M_0) },
+  },
+  {
+    /* MOD_VEX_0F385E_X86_64_P_2_W_0 */
+    { Bad_Opcode },
+    { VEX_LEN_TABLE (VEX_LEN_0F385E_X86_64_P_2_W_0_M_0) },
+  },
+  {
+    /* MOD_VEX_0F385E_X86_64_P_3_W_0 */
+    { Bad_Opcode },
+    { VEX_LEN_TABLE (VEX_LEN_0F385E_X86_64_P_3_W_0_M_0) },
+  },
   {
     /* MOD_0F38F5_PREFIX_2 */
     { "wrussK",                { M, Gdq }, PREFIX_OPCODE },
@@ -10808,11 +11463,11 @@ static const struct dis386 mod_table[][2] = {
   },
   {
     /* MOD_VEX_0F388C_PREFIX_2 */
-    { "vpmaskmov%LW",  { XM, Vex, Mx }, 0 },
+    { "vpmaskmov%DQ",  { XM, Vex, Mx }, 0 },
   },
   {
     /* MOD_VEX_0F388E_PREFIX_2 */
-    { "vpmaskmov%LW",  { Mx, Vex, XM }, 0 },
+    { "vpmaskmov%DQ",  { Mx, Vex, XM }, 0 },
   },
   {
     /* MOD_VEX_W_0_0F3A30_P_2_LEN_0 */
@@ -10854,6 +11509,11 @@ static const struct dis386 mod_table[][2] = {
     { Bad_Opcode },
     { "kshiftlq",       { MaskG, MaskR, Ib }, 0 },
   },
+  {
+    /* MOD_VEX_0FXOP_09_12 */
+    { Bad_Opcode },
+    { VEX_LEN_TABLE (VEX_LEN_0FXOP_09_12_M_1) },
+  },
 
 #include "i386-dis-evex-mod.h"
 };
@@ -10949,6 +11609,10 @@ static const struct dis386 rm_table[][8] = {
     { "sfence",                { Skip_MODRM }, 0 },
 
   },
+  {
+    /* RM_VEX_0F3849_X86_64_P_0_W_0_M_1_R_0 */
+    { VEX_LEN_TABLE (VEX_LEN_0F3849_X86_64_P_0_W_0_M_1_REG_0_RM_0) },
+  },
 };
 
 #define INTERNAL_DISASSEMBLER_ERROR _("<internal disassembler error>")
@@ -11474,7 +12138,6 @@ get_valid_dis386 (const struct dis386 *dp, disassemble_info *info)
          break;
        }
       need_vex = 1;
-      need_vex_reg = 1;
       codep++;
       vindex = *codep++;
       dp = &xop_table[vex_table_index][vindex];
@@ -11484,6 +12147,11 @@ get_valid_dis386 (const struct dis386 *dp, disassemble_info *info)
       modrm.mod = (*codep >> 6) & 3;
       modrm.reg = (*codep >> 3) & 7;
       modrm.rm = *codep & 7;
+
+      /* No XOP encoding so far allows for a non-zero embedded prefix. Avoid
+        having to decode the bits for every otherwise valid encoding.  */
+      if (vex.prefix)
+       return &bad_opcode;
       break;
 
     case USE_VEX_C4_TABLE:
@@ -11536,7 +12204,6 @@ get_valid_dis386 (const struct dis386 *dp, disassemble_info *info)
          break;
        }
       need_vex = 1;
-      need_vex_reg = 1;
       codep++;
       vindex = *codep++;
       dp = &vex_table[vex_table_index][vindex];
@@ -11575,7 +12242,6 @@ get_valid_dis386 (const struct dis386 *dp, disassemble_info *info)
          break;
        }
       need_vex = 1;
-      need_vex_reg = 1;
       codep++;
       vindex = *codep++;
       dp = &vex_table[dp->op[1].bytemode][vindex];
@@ -11667,7 +12333,6 @@ get_valid_dis386 (const struct dis386 *dp, disassemble_info *info)
        }
 
       need_vex = 1;
-      need_vex_reg = 1;
       codep++;
       vindex = *codep++;
       dp = &evex_table[vex_table_index][vindex];
@@ -11840,6 +12505,7 @@ print_insn (bfd_vma pc, disassemble_info *info)
       names_xmm = intel_names_xmm;
       names_ymm = intel_names_ymm;
       names_zmm = intel_names_zmm;
+      names_tmm = intel_names_tmm;
       index64 = intel_index64;
       index32 = intel_index32;
       names_mask = intel_names_mask;
@@ -11862,6 +12528,7 @@ print_insn (bfd_vma pc, disassemble_info *info)
       names_xmm = att_names_xmm;
       names_ymm = att_names_ymm;
       names_zmm = att_names_zmm;
+      names_tmm = att_names_tmm;
       index64 = att_index64;
       index32 = att_index32;
       names_mask = att_names_mask;
@@ -11990,8 +12657,6 @@ print_insn (bfd_vma pc, disassemble_info *info)
     }
 
   need_vex = 0;
-  need_vex_reg = 0;
-  vex_w_done = 0;
   memset (&vex, 0, sizeof (vex));
 
   if (dp->name == NULL && dp->op[0].bytemode == FLOATCODE)
@@ -12620,17 +13285,18 @@ putop (const char *in_template, int sizeflag)
   const char *p;
   int alt = 0;
   int cond = 1;
-  unsigned int l = 0, len = 1;
+  unsigned int l = 0, len = 0;
   char last[4];
 
-#define SAVE_LAST(c)                   \
-  if (l < len && l < sizeof (last))    \
-    last[l++] = c;                     \
-  else                                 \
-    abort ();
-
   for (p = in_template; *p; p++)
     {
+      if (len > l)
+       {
+         if (l >= sizeof (last) || !ISUPPER (*p))
+           abort ();
+         last[l++] = *p;
+         continue;
+       }
       switch (*p)
        {
        default:
@@ -12668,7 +13334,7 @@ putop (const char *in_template, int sizeflag)
            *obufp++ = 'b';
          break;
        case 'B':
-         if (l == 0 && len == 1)
+         if (l == 0)
            {
            case_B:
              if (intel_syntax)
@@ -12676,16 +13342,8 @@ putop (const char *in_template, int sizeflag)
              if (sizeflag & SUFFIX_ALWAYS)
                *obufp++ = 'b';
            }
-         else
+         else if (l == 1 && last[0] == 'L')
            {
-             if (l != 1
-                 || len != 2
-                 || last[0] != 'L')
-               {
-                 SAVE_LAST (*p);
-                 break;
-               }
-
              if (address_mode == mode_64bit
                  && !(prefixes & PREFIX_ADDR))
                {
@@ -12696,6 +13354,8 @@ putop (const char *in_template, int sizeflag)
 
              goto case_B;
            }
+         else
+           abort ();
          break;
        case 'C':
          if (intel_syntax && !alt)
@@ -12787,13 +13447,10 @@ putop (const char *in_template, int sizeflag)
            *obufp++ = 'd';
          break;
        case 'Z':
-         if (l != 0 || len != 1)
+         if (l != 0)
            {
-             if (l != 1 || len != 2 || last[0] != 'X')
-               {
-                 SAVE_LAST (*p);
-                 break;
-               }
+             if (l != 1 || last[0] != 'X')
+               abort ();
              if (!need_vex || !vex.evex)
                abort ();
              if (intel_syntax
@@ -12825,11 +13482,8 @@ putop (const char *in_template, int sizeflag)
          /* Fall through.  */
          goto case_L;
        case 'L':
-         if (l != 0 || len != 1)
-           {
-             SAVE_LAST (*p);
-             break;
-           }
+         if (l != 0)
+           abort ();
        case_L:
          if (intel_syntax)
            break;
@@ -12877,7 +13531,7 @@ putop (const char *in_template, int sizeflag)
          /* Fall through.  */
          goto case_P;
        case 'P':
-         if (l == 0 && len == 1)
+         if (l == 0)
            {
            case_P:
              if (intel_syntax)
@@ -12908,14 +13562,8 @@ putop (const char *in_template, int sizeflag)
                    }
                }
            }
-         else
+         else if (l == 1 && last[0] == 'L')
            {
-             if (l != 1 || len != 2 || last[0] != 'L')
-               {
-                 SAVE_LAST (*p);
-                 break;
-               }
-
              if ((prefixes & PREFIX_DATA)
                  || (rex & REX_W)
                  || (sizeflag & SUFFIX_ALWAYS))
@@ -12933,6 +13581,8 @@ putop (const char *in_template, int sizeflag)
                    }
                }
            }
+         else
+           abort ();
          break;
        case 'U':
          if (intel_syntax)
@@ -12947,7 +13597,7 @@ putop (const char *in_template, int sizeflag)
          /* Fall through.  */
          goto case_Q;
        case 'Q':
-         if (l == 0 && len == 1)
+         if (l == 0)
            {
            case_Q:
              if (intel_syntax && !alt)
@@ -12967,25 +13617,24 @@ putop (const char *in_template, int sizeflag)
                    }
                }
            }
-         else
+         else if (l == 1 && last[0] == 'D')
+           *obufp++ = vex.w ? 'q' : 'd';
+         else if (l == 1 && last[0] == 'L')
            {
-             if (l != 1 || len != 2 || last[0] != 'L')
-               {
-                 SAVE_LAST (*p);
-                 break;
-               }
-             if ((intel_syntax && need_modrm)
-                 || (modrm.mod == 3 && !(sizeflag & SUFFIX_ALWAYS)))
+             if (cond ? modrm.mod == 3 && !(sizeflag & SUFFIX_ALWAYS)
+                      : address_mode != mode_64bit)
                break;
              if ((rex & REX_W))
                {
                  USED_REX (REX_W);
                  *obufp++ = 'q';
                }
-             else if((address_mode == mode_64bit && need_modrm)
+             else if((address_mode == mode_64bit && need_modrm && cond)
                      || (sizeflag & SUFFIX_ALWAYS))
                *obufp++ = intel_syntax? 'd' : 'l';
            }
+         else
+           abort ();
          break;
        case 'R':
          USED_REX (REX_W);
@@ -13007,7 +13656,7 @@ putop (const char *in_template, int sizeflag)
            used_prefixes |= (prefixes & PREFIX_DATA);
          break;
        case 'V':
-         if (l == 0 && len == 1)
+         if (l == 0)
            {
              if (intel_syntax)
                break;
@@ -13019,16 +13668,8 @@ putop (const char *in_template, int sizeflag)
                  break;
                }
            }
-         else
+         else if (l == 1 && last[0] == 'L')
            {
-             if (l != 1
-                 || len != 2
-                 || last[0] != 'L')
-               {
-                 SAVE_LAST (*p);
-                 break;
-               }
-
              if (rex & REX_W)
                {
                  *obufp++ = 'a';
@@ -13036,10 +13677,12 @@ putop (const char *in_template, int sizeflag)
                  *obufp++ = 's';
                }
            }
+         else
+           abort ();
          /* Fall through.  */
          goto case_S;
        case 'S':
-         if (l == 0 && len == 1)
+         if (l == 0)
            {
            case_S:
              if (intel_syntax)
@@ -13058,16 +13701,8 @@ putop (const char *in_template, int sizeflag)
                    }
                }
            }
-         else
+         else if (l == 1 && last[0] == 'L')
            {
-             if (l != 1
-                 || len != 2
-                 || last[0] != 'L')
-               {
-                 SAVE_LAST (*p);
-                 break;
-               }
-
              if (address_mode == mode_64bit
                  && !(prefixes & PREFIX_ADDR))
                {
@@ -13078,13 +13713,12 @@ putop (const char *in_template, int sizeflag)
 
              goto case_S;
            }
+         else
+           abort ();
          break;
        case 'X':
-         if (l != 0 || len != 1)
-           {
-             SAVE_LAST (*p);
-             break;
-           }
+         if (l != 0)
+           abort ();
          if (need_vex
              ? vex.prefix == DATA_PREFIX_OPCODE
              : prefixes & PREFIX_DATA)
@@ -13096,15 +13730,8 @@ putop (const char *in_template, int sizeflag)
            *obufp++ = 's';
          break;
        case 'Y':
-         if (l == 0 && len == 1)
-           abort ();
-         else
+         if (l == 1 && last[0] == 'X')
            {
-             if (l != 1 || len != 2 || last[0] != 'X')
-               {
-                 SAVE_LAST (*p);
-                 break;
-               }
              if (!need_vex)
                abort ();
              if (intel_syntax
@@ -13124,9 +13751,11 @@ putop (const char *in_template, int sizeflag)
                    abort ();
                }
            }
+         else
+           abort ();
          break;
        case 'W':
-         if (l == 0 && len == 1)
+         if (l == 0)
            {
              /* operand size flag for cwtl, cbtw */
              USED_REX (REX_W);
@@ -13144,23 +13773,19 @@ putop (const char *in_template, int sizeflag)
              if (!(rex & REX_W))
                used_prefixes |= (prefixes & PREFIX_DATA);
            }
-         else
+         else if (l == 1)
            {
-             if (l != 1
-                 || len != 2
-                 || (last[0] != 'X'
-                     && last[0] != 'L'))
-               {
-                 SAVE_LAST (*p);
-                 break;
-               }
              if (!need_vex)
                abort ();
              if (last[0] == 'X')
                *obufp++ = vex.w ? 'd': 's';
+             else if (last[0] == 'B')
+               *obufp++ = vex.w ? 'w': 'b';
              else
-               *obufp++ = vex.w ? 'q': 'd';
+               abort ();
            }
+         else
+           abort ();
          break;
        case '^':
          if (intel_syntax)
@@ -13195,6 +13820,9 @@ putop (const char *in_template, int sizeflag)
            }
          break;
        }
+
+      if (len == l)
+       len = l = 0;
     }
   *obufp = 0;
   mnemonicendp = obufp;
@@ -13427,13 +14055,11 @@ intel_operand_size (int bytemode, int sizeflag)
       used_prefixes |= (prefixes & PREFIX_DATA);
       break;
     case d_mode:
-    case d_scalar_swap_mode:
     case d_swap_mode:
     case dqd_mode:
       oappend ("DWORD PTR ");
       break;
     case q_mode:
-    case q_scalar_swap_mode:
     case q_swap_mode:
       oappend ("QWORD PTR ");
       break;
@@ -13457,8 +14083,7 @@ intel_operand_size (int bytemode, int sizeflag)
     case x_swap_mode:
     case evex_x_gscat_mode:
     case evex_x_nobcst_mode:
-    case b_scalar_mode:
-    case w_scalar_mode:
+    case bw_unit_mode:
       if (need_vex)
        {
          switch (vex.length)
@@ -13742,7 +14367,8 @@ OP_E_register (int bytemode, int sizeflag)
     {
     case b_mode:
     case b_swap_mode:
-      USED_REX (0);
+      if (reg & 4)
+       USED_REX (0);
       if (rex)
        names = names8rex;
       else
@@ -13870,15 +14496,21 @@ OP_E_memory (int bytemode, int sizeflag)
        {
        case dqw_mode:
        case dw_mode:
+       case xmm_mw_mode:
          shift = 1;
          break;
        case dqb_mode:
        case db_mode:
+       case xmm_mb_mode:
          shift = 0;
          break;
        case dq_mode:
          if (address_mode != mode_64bit)
            {
+       case dqd_mode:
+       case xmm_md_mode:
+       case d_mode:
+       case d_swap_mode:
              shift = 2;
              break;
            }
@@ -13919,6 +14551,15 @@ OP_E_memory (int bytemode, int sizeflag)
            default:
              abort ();
            }
+         /* Make necessary corrections to shift for modes that need it.  */
+         if (bytemode == xmmq_mode
+             || bytemode == evex_half_bcst_xmmq_mode
+             || (bytemode == ymmq_mode && vex.length == 128))
+           shift -= 1;
+         else if (bytemode == xmmqd_mode)
+           shift -= 2;
+         else if (bytemode == xmmdw_mode)
+           shift -= 3;
          break;
        case ymm_mode:
          shift = 5;
@@ -13929,43 +14570,14 @@ OP_E_memory (int bytemode, int sizeflag)
        case xmm_mq_mode:
        case q_mode:
        case q_swap_mode:
-       case q_scalar_swap_mode:
          shift = 3;
          break;
-       case dqd_mode:
-       case xmm_md_mode:
-       case d_mode:
-       case d_swap_mode:
-       case d_scalar_swap_mode:
-         shift = 2;
-         break;
-       case w_scalar_mode:
-       case xmm_mw_mode:
-         shift = 1;
-         break;
-       case b_scalar_mode:
-       case xmm_mb_mode:
-         shift = 0;
+       case bw_unit_mode:
+         shift = vex.w ? 1 : 0;
          break;
        default:
          abort ();
        }
-      /* Make necessary corrections to shift for modes that need it.
-        For these modes we currently have shift 4, 5 or 6 depending on
-        vex.length (it corresponds to xmmword, ymmword or zmmword
-        operand).  We might want to make it 3, 4 or 5 (e.g. for
-        xmmq_mode).  In case of broadcast enabled the corrections
-        aren't needed, as element size is always 32 or 64 bits.  */
-      if (!vex.b
-         && (bytemode == xmmq_mode
-             || bytemode == evex_half_bcst_xmmq_mode))
-       shift -= 1;
-      else if (bytemode == xmmqd_mode)
-       shift -= 2;
-      else if (bytemode == xmmdw_mode)
-       shift -= 3;
-      else if (bytemode == ymmq_mode && vex.length == 128)
-       shift -= 1;
     }
   else
     shift = 0;
@@ -14055,6 +14667,15 @@ OP_E_memory (int bytemode, int sizeflag)
          base = sib.base;
          codep++;
        }
+      else
+       {
+         /* mandatory non-vector SIB must have sib */
+         if (bytemode == vex_sibmem_mode)
+           {
+             oappend ("(bad)");
+             return;
+           }
+       }
       rbase = base + add;
 
       switch (modrm.mod)
@@ -14362,7 +14983,8 @@ OP_G (int bytemode, int sizeflag)
   switch (bytemode)
     {
     case b_mode:
-      USED_REX (0);
+      if (modrm.reg & 4)
+       USED_REX (0);
       if (rex)
        oappend (names8rex[modrm.reg + add]);
       else
@@ -14553,9 +15175,10 @@ OP_REG (int code, int sizeflag)
     case sp_reg: case bp_reg: case si_reg: case di_reg:
       s = names16[code - ax_reg + add];
       break;
-    case al_reg: case ah_reg: case cl_reg: case ch_reg:
-    case dl_reg: case dh_reg: case bl_reg: case bh_reg:
+    case ah_reg: case ch_reg: case dh_reg: case bh_reg:
       USED_REX (0);
+      /* Fall through.  */
+    case al_reg: case cl_reg: case dl_reg: case bl_reg:
       if (rex)
        s = names8rex[code - al_reg + add];
       else
@@ -14605,36 +15228,17 @@ OP_IMREG (int code, int sizeflag)
       else
        s = "(%dx)";
       break;
-    case ax_reg: case cx_reg: case dx_reg: case bx_reg:
-    case sp_reg: case bp_reg: case si_reg: case di_reg:
-      s = names16[code - ax_reg];
-      break;
-    case es_reg: case ss_reg: case cs_reg:
-    case ds_reg: case fs_reg: case gs_reg:
-      s = names_seg[code - es_reg];
+    case al_reg: case cl_reg:
+      s = names8[code - al_reg];
       break;
-    case al_reg: case ah_reg: case cl_reg: case ch_reg:
-    case dl_reg: case dh_reg: case bl_reg: case bh_reg:
-      USED_REX (0);
-      if (rex)
-       s = names8rex[code - al_reg];
-      else
-       s = names8[code - al_reg];
-      break;
-    case eAX_reg: case eCX_reg: case eDX_reg: case eBX_reg:
-    case eSP_reg: case eBP_reg: case eSI_reg: case eDI_reg:
+    case eAX_reg:
       USED_REX (REX_W);
       if (rex & REX_W)
-       s = names64[code - eAX_reg];
-      else
        {
-         if (sizeflag & DFLAG)
-           s = names32[code - eAX_reg];
-         else
-           s = names16[code - eAX_reg];
-         used_prefixes |= (prefixes & PREFIX_DATA);
+         s = *names64;
+         break;
        }
-      break;
+      /* Fall through.  */
     case z_mode_ax_reg:
       if ((rex & REX_W) || (sizeflag & DFLAG))
        s = *names32;
@@ -15082,6 +15686,7 @@ OP_XMM (int bytemode, int sizeflag ATTRIBUTE_UNUSED)
       && bytemode != xmmq_mode
       && bytemode != evex_half_bcst_xmmq_mode
       && bytemode != ymm_mode
+      && bytemode != tmm_mode
       && bytemode != scalar_mode)
     {
       switch (vex.length)
@@ -15120,6 +15725,16 @@ OP_XMM (int bytemode, int sizeflag ATTRIBUTE_UNUSED)
          abort ();
        }
     }
+  else if (bytemode == tmm_mode)
+    {
+      modrm.reg = reg;
+      if (reg >= 8)
+       {
+         oappend ("(bad)");
+         return;
+       }
+      names = names_tmm;
+    }
   else if (bytemode == ymm_mode)
     names = names_ymm;
   else
@@ -15228,9 +15843,7 @@ OP_EX (int bytemode, int sizeflag)
   if ((sizeflag & SUFFIX_ALWAYS)
       && (bytemode == x_swap_mode
          || bytemode == d_swap_mode
-         || bytemode == d_scalar_swap_mode
-         || bytemode == q_swap_mode
-         || bytemode == q_scalar_swap_mode))
+         || bytemode == q_swap_mode))
     swap_operand ();
 
   if (need_vex
@@ -15244,8 +15857,7 @@ OP_EX (int bytemode, int sizeflag)
       && bytemode != xmmq_mode
       && bytemode != evex_half_bcst_xmmq_mode
       && bytemode != ymm_mode
-      && bytemode != d_scalar_swap_mode
-      && bytemode != q_scalar_swap_mode
+      && bytemode != tmm_mode
       && bytemode != vex_scalar_w_dq_mode)
     {
       switch (vex.length)
@@ -15279,6 +15891,16 @@ OP_EX (int bytemode, int sizeflag)
          abort ();
        }
     }
+  else if (bytemode == tmm_mode)
+    {
+      modrm.rm = reg;
+      if (reg >= 8)
+       {
+         oappend ("(bad)");
+         return;
+       }
+      names = names_tmm;
+    }
   else if (bytemode == ymm_mode)
     names = names_ymm;
   else
@@ -15441,7 +16063,7 @@ OP_3DNowSuffix (int bytemode ATTRIBUTE_UNUSED, int sizeflag ATTRIBUTE_UNUSED)
   mnemonicendp = obufp;
 }
 
-static struct op simd_cmp_op[] =
+static const struct op simd_cmp_op[] =
 {
   { STRING_COMMA_LEN ("eq") },
   { STRING_COMMA_LEN ("lt") },
@@ -15453,6 +16075,34 @@ static struct op simd_cmp_op[] =
   { STRING_COMMA_LEN ("ord") }
 };
 
+static const struct op vex_cmp_op[] =
+{
+  { STRING_COMMA_LEN ("eq_uq") },
+  { STRING_COMMA_LEN ("nge") },
+  { STRING_COMMA_LEN ("ngt") },
+  { STRING_COMMA_LEN ("false") },
+  { STRING_COMMA_LEN ("neq_oq") },
+  { STRING_COMMA_LEN ("ge") },
+  { STRING_COMMA_LEN ("gt") },
+  { STRING_COMMA_LEN ("true") },
+  { STRING_COMMA_LEN ("eq_os") },
+  { STRING_COMMA_LEN ("lt_oq") },
+  { STRING_COMMA_LEN ("le_oq") },
+  { STRING_COMMA_LEN ("unord_s") },
+  { STRING_COMMA_LEN ("neq_us") },
+  { STRING_COMMA_LEN ("nlt_uq") },
+  { STRING_COMMA_LEN ("nle_uq") },
+  { STRING_COMMA_LEN ("ord_s") },
+  { STRING_COMMA_LEN ("eq_us") },
+  { STRING_COMMA_LEN ("nge_uq") },
+  { STRING_COMMA_LEN ("ngt_uq") },
+  { STRING_COMMA_LEN ("false_os") },
+  { STRING_COMMA_LEN ("neq_os") },
+  { STRING_COMMA_LEN ("ge_oq") },
+  { STRING_COMMA_LEN ("gt_oq") },
+  { STRING_COMMA_LEN ("true_us") },
+};
+
 static void
 CMP_Fixup (int bytemode ATTRIBUTE_UNUSED, int sizeflag ATTRIBUTE_UNUSED)
 {
@@ -15470,6 +16120,18 @@ CMP_Fixup (int bytemode ATTRIBUTE_UNUSED, int sizeflag ATTRIBUTE_UNUSED)
       sprintf (p, "%s%s", simd_cmp_op[cmp_type].name, suffix);
       mnemonicendp += simd_cmp_op[cmp_type].len;
     }
+  else if (need_vex
+          && cmp_type < ARRAY_SIZE (simd_cmp_op) + ARRAY_SIZE (vex_cmp_op))
+    {
+      char suffix [3];
+      char *p = mnemonicendp - 2;
+      suffix[0] = p[0];
+      suffix[1] = p[1];
+      suffix[2] = '\0';
+      cmp_type -= ARRAY_SIZE (simd_cmp_op);
+      sprintf (p, "%s%s", vex_cmp_op[cmp_type].name, suffix);
+      mnemonicendp += vex_cmp_op[cmp_type].len;
+    }
   else
     {
       /* We have a reserved extension byte.  Output it directly.  */
@@ -15698,77 +16360,6 @@ XMM_Fixup (int reg, int sizeflag ATTRIBUTE_UNUSED)
   oappend (names[reg]);
 }
 
-static void
-CRC32_Fixup (int bytemode, int sizeflag)
-{
-  /* Add proper suffix to "crc32".  */
-  char *p = mnemonicendp;
-
-  switch (bytemode)
-    {
-    case b_mode:
-      if (intel_syntax)
-       goto skip;
-
-      *p++ = 'b';
-      break;
-    case v_mode:
-      if (intel_syntax)
-       goto skip;
-
-      USED_REX (REX_W);
-      if (rex & REX_W)
-       *p++ = 'q';
-      else
-       {
-         if (sizeflag & DFLAG)
-           *p++ = 'l';
-         else
-           *p++ = 'w';
-         used_prefixes |= (prefixes & PREFIX_DATA);
-       }
-      break;
-    default:
-      oappend (INTERNAL_DISASSEMBLER_ERROR);
-      break;
-    }
-  mnemonicendp = p;
-  *p = '\0';
-
- skip:
-  if (modrm.mod == 3)
-    {
-      int add;
-
-      /* Skip mod/rm byte.  */
-      MODRM_CHECK;
-      codep++;
-
-      USED_REX (REX_B);
-      add = (rex & REX_B) ? 8 : 0;
-      if (bytemode == b_mode)
-       {
-         USED_REX (0);
-         if (rex)
-           oappend (names8rex[modrm.rm + add]);
-         else
-           oappend (names8[modrm.rm + add]);
-       }
-      else
-       {
-         USED_REX (REX_W);
-         if (rex & REX_W)
-           oappend (names64[modrm.rm + add]);
-         else if ((prefixes & PREFIX_DATA))
-           oappend (names16[modrm.rm + add]);
-         else
-           oappend (names32[modrm.rm + add]);
-       }
-    }
-  else
-    OP_E (bytemode, sizeflag);
-}
-
 static void
 FXSAVE_Fixup (int bytemode, int sizeflag)
 {
@@ -15785,27 +16376,6 @@ FXSAVE_Fixup (int bytemode, int sizeflag)
   OP_M (bytemode, sizeflag);
 }
 
-static void
-PCMPESTR_Fixup (int bytemode, int sizeflag)
-{
-  /* Add proper suffix to "{,v}pcmpestr{i,m}".  */
-  if (!intel_syntax)
-    {
-      char *p = mnemonicendp;
-
-      USED_REX (REX_W);
-      if (rex & REX_W)
-       *p++ = 'q';
-      else if (sizeflag & SUFFIX_ALWAYS)
-       *p++ = 'l';
-
-      *p = '\0';
-      mnemonicendp = p;
-    }
-
-  OP_EX (bytemode, sizeflag);
-}
-
 /* Display the destination register operand for instructions with
    VEX. */
 
@@ -15818,9 +16388,6 @@ OP_VEX (int bytemode, int sizeflag ATTRIBUTE_UNUSED)
   if (!need_vex)
     abort ();
 
-  if (!need_vex_reg)
-    return;
-
   reg = vex.register_specifier;
   vex.register_specifier = 0;
   if (address_mode != mode_64bit)
@@ -15834,13 +16401,40 @@ OP_VEX (int bytemode, int sizeflag ATTRIBUTE_UNUSED)
       return;
     }
 
+  if (bytemode == tmm_mode)
+    {
+      /* All 3 TMM registers must be distinct.  */
+      if (reg >= 8)
+       oappend ("(bad)");
+      else
+       {
+         /* This must be the 3rd operand.  */
+         if (obufp != op_out[2])
+           abort ();
+         oappend (names_tmm[reg]);
+         if (reg == modrm.reg || reg == modrm.rm)
+           strcpy (obufp, "/(bad)");
+       }
+
+      if (modrm.reg == modrm.rm || modrm.reg == reg || modrm.rm == reg)
+       {
+         if (modrm.reg <= 8
+             && (modrm.reg == modrm.rm || modrm.reg == reg))
+           strcat (op_out[0], "/(bad)");
+         if (modrm.rm <= 8
+             && (modrm.rm == modrm.reg || modrm.rm == reg))
+           strcat (op_out[1], "/(bad)");
+       }
+
+      return;
+    }
+
   switch (vex.length)
     {
     case 128:
       switch (bytemode)
        {
        case vex_mode:
-       case vex128_mode:
        case vex_vsib_q_w_dq_mode:
        case vex_vsib_q_w_d_mode:
          names = names_xmm;
@@ -15869,7 +16463,6 @@ OP_VEX (int bytemode, int sizeflag ATTRIBUTE_UNUSED)
       switch (bytemode)
        {
        case vex_mode:
-       case vex256_mode:
          names = names_ymm;
          break;
        case vex_vsib_q_w_dq_mode:
@@ -15901,380 +16494,64 @@ OP_VEX (int bytemode, int sizeflag ATTRIBUTE_UNUSED)
   oappend (names[reg]);
 }
 
-/* Get the VEX immediate byte without moving codep.  */
-
-static unsigned char
-get_vex_imm8 (int sizeflag, int opnum)
-{
-  int bytes_before_imm = 0;
-
-  if (modrm.mod != 3)
-    {
-      /* There are SIB/displacement bytes.  */
-      if ((sizeflag & AFLAG) || address_mode == mode_64bit)
-       {
-         /* 32/64 bit address mode */
-         int base = modrm.rm;
-
-         /* Check SIB byte.  */
-         if (base == 4)
-           {
-             FETCH_DATA (the_info, codep + 1);
-             base = *codep & 7;
-             /* When decoding the third source, don't increase
-                bytes_before_imm as this has already been incremented
-                by one in OP_E_memory while decoding the second
-                source operand.  */
-             if (opnum == 0)
-               bytes_before_imm++;
-           }
-
-         /* Don't increase bytes_before_imm when decoding the third source,
-            it has already been incremented by OP_E_memory while decoding
-            the second source operand.  */
-         if (opnum == 0)
-           {
-             switch (modrm.mod)
-               {
-                 case 0:
-                   /* When modrm.rm == 5 or modrm.rm == 4 and base in
-                      SIB == 5, there is a 4 byte displacement.  */
-                   if (base != 5)
-                     /* No displacement. */
-                     break;
-                   /* Fall through.  */
-                 case 2:
-                   /* 4 byte displacement.  */
-                   bytes_before_imm += 4;
-                   break;
-                 case 1:
-                   /* 1 byte displacement.  */
-                   bytes_before_imm++;
-                   break;
-               }
-           }
-       }
-      else
-       {
-         /* 16 bit address mode */
-         /* Don't increase bytes_before_imm when decoding the third source,
-            it has already been incremented by OP_E_memory while decoding
-            the second source operand.  */
-         if (opnum == 0)
-           {
-             switch (modrm.mod)
-               {
-               case 0:
-                 /* When modrm.rm == 6, there is a 2 byte displacement.  */
-                 if (modrm.rm != 6)
-                   /* No displacement. */
-                   break;
-                 /* Fall through.  */
-               case 2:
-                 /* 2 byte displacement.  */
-                 bytes_before_imm += 2;
-                 break;
-               case 1:
-                 /* 1 byte displacement: when decoding the third source,
-                    don't increase bytes_before_imm as this has already
-                    been incremented by one in OP_E_memory while decoding
-                    the second source operand.  */
-                 if (opnum == 0)
-                   bytes_before_imm++;
-
-                 break;
-               }
-           }
-       }
-    }
-
-  FETCH_DATA (the_info, codep + bytes_before_imm + 1);
-  return codep [bytes_before_imm];
-}
-
-static void
-OP_EX_VexReg (int bytemode, int sizeflag, int reg)
-{
-  const char **names;
-
-  if (reg == -1 && modrm.mod != 3)
-    {
-      OP_E_memory (bytemode, sizeflag);
-      return;
-    }
-  else
-    {
-      if (reg == -1)
-       {
-         reg = modrm.rm;
-         USED_REX (REX_B);
-         if (rex & REX_B)
-           reg += 8;
-       }
-      if (address_mode != mode_64bit)
-       reg &= 7;
-    }
-
-  switch (vex.length)
-    {
-    case 128:
-      names = names_xmm;
-      break;
-    case 256:
-      names = names_ymm;
-      break;
-    default:
-      abort ();
-    }
-  oappend (names[reg]);
-}
-
 static void
-OP_EX_VexImmW (int bytemode, int sizeflag)
-{
-  int reg = -1;
-  static unsigned char vex_imm8;
-
-  if (vex_w_done == 0)
-    {
-      vex_w_done = 1;
-
-      /* Skip mod/rm byte.  */
-      MODRM_CHECK;
-      codep++;
-
-      vex_imm8 = get_vex_imm8 (sizeflag, 0);
-
-      if (vex.w)
-         reg = vex_imm8 >> 4;
-
-      OP_EX_VexReg (bytemode, sizeflag, reg);
-    }
-  else if (vex_w_done == 1)
-    {
-      vex_w_done = 2;
-
-      if (!vex.w)
-         reg = vex_imm8 >> 4;
-
-      OP_EX_VexReg (bytemode, sizeflag, reg);
-    }
-  else
-    {
-      /* Output the imm8 directly.  */
-      scratchbuf[0] = '$';
-      print_operand_value (scratchbuf + 1, 1, vex_imm8 & 0xf);
-      oappend_maybe_intel (scratchbuf);
-      scratchbuf[0] = '\0';
-      codep++;
-    }
-}
-
-static void
-OP_Vex_2src (int bytemode, int sizeflag)
+OP_VexR (int bytemode, int sizeflag)
 {
   if (modrm.mod == 3)
-    {
-      int reg = modrm.rm;
-      USED_REX (REX_B);
-      if (rex & REX_B)
-       reg += 8;
-      oappend (names_xmm[reg]);
-    }
-  else
-    {
-      if (intel_syntax
-         && (bytemode == v_mode || bytemode == v_swap_mode))
-       {
-         bytemode = (prefixes & PREFIX_DATA) ? x_mode : q_mode;
-         used_prefixes |= (prefixes & PREFIX_DATA);
-       }
-      OP_E (bytemode, sizeflag);
-    }
+    OP_VEX (bytemode, sizeflag);
 }
 
 static void
-OP_Vex_2src_1 (int bytemode, int sizeflag)
+OP_VexW (int bytemode, int sizeflag)
 {
-  if (modrm.mod == 3)
-    {
-      /* Skip mod/rm byte.   */
-      MODRM_CHECK;
-      codep++;
-    }
-
-  if (vex.w)
-    {
-      unsigned int reg = vex.register_specifier;
-      vex.register_specifier = 0;
-
-      if (address_mode != mode_64bit)
-       reg &= 7;
-      oappend (names_xmm[reg]);
-    }
-  else
-    OP_Vex_2src (bytemode, sizeflag);
-}
+  OP_VEX (bytemode, sizeflag);
 
-static void
-OP_Vex_2src_2 (int bytemode, int sizeflag)
-{
   if (vex.w)
-    OP_Vex_2src (bytemode, sizeflag);
-  else
-    {
-      unsigned int reg = vex.register_specifier;
-      vex.register_specifier = 0;
-
-      if (address_mode != mode_64bit)
-       reg &= 7;
-      oappend (names_xmm[reg]);
-    }
-}
-
-static void
-OP_EX_VexW (int bytemode, int sizeflag)
-{
-  int reg = -1;
-
-  if (!vex_w_done)
-    {
-      /* Skip mod/rm byte.  */
-      MODRM_CHECK;
-      codep++;
-
-      if (vex.w)
-       reg = get_vex_imm8 (sizeflag, 0) >> 4;
-    }
-  else
     {
-      if (!vex.w)
-       reg = get_vex_imm8 (sizeflag, 1) >> 4;
+      /* Swap 2nd and 3rd operands.  */
+      strcpy (scratchbuf, op_out[2]);
+      strcpy (op_out[2], op_out[1]);
+      strcpy (op_out[1], scratchbuf);
     }
-
-  OP_EX_VexReg (bytemode, sizeflag, reg);
-
-  if (vex_w_done)
-    codep++;
-  vex_w_done = 1;
 }
 
 static void
 OP_REG_VexI4 (int bytemode, int sizeflag ATTRIBUTE_UNUSED)
 {
   int reg;
-  const char **names;
+  const char **names = names_xmm;
 
   FETCH_DATA (the_info, codep + 1);
   reg = *codep++;
 
-  if (bytemode != x_mode)
+  if (bytemode != x_mode && bytemode != scalar_mode)
     abort ();
 
   reg >>= 4;
   if (address_mode != mode_64bit)
     reg &= 7;
 
-  switch (vex.length)
-    {
-    case 128:
-      names = names_xmm;
-      break;
-    case 256:
-      names = names_ymm;
-      break;
-    default:
-      abort ();
-    }
-  oappend (names[reg]);
-}
-
-static void
-OP_XMM_VexW (int bytemode, int sizeflag)
-{
-  /* Turn off the REX.W bit since it is used for swapping operands
-     now.  */
-  rex &= ~REX_W;
-  OP_XMM (bytemode, sizeflag);
-}
+  if (bytemode == x_mode && vex.length == 256)
+    names = names_ymm;
 
-static void
-OP_EX_Vex (int bytemode, int sizeflag)
-{
-  if (modrm.mod != 3)
-    need_vex_reg = 0;
-  OP_EX (bytemode, sizeflag);
-}
+  oappend (names[reg]);
 
-static void
-OP_XMM_Vex (int bytemode, int sizeflag)
-{
-  if (modrm.mod != 3)
-    need_vex_reg = 0;
-  OP_XMM (bytemode, sizeflag);
+  if (vex.w)
+    {
+      /* Swap 3rd and 4th operands.  */
+      strcpy (scratchbuf, op_out[3]);
+      strcpy (op_out[3], op_out[2]);
+      strcpy (op_out[2], scratchbuf);
+    }
 }
 
-static struct op vex_cmp_op[] =
-{
-  { STRING_COMMA_LEN ("eq") },
-  { STRING_COMMA_LEN ("lt") },
-  { STRING_COMMA_LEN ("le") },
-  { STRING_COMMA_LEN ("unord") },
-  { STRING_COMMA_LEN ("neq") },
-  { STRING_COMMA_LEN ("nlt") },
-  { STRING_COMMA_LEN ("nle") },
-  { STRING_COMMA_LEN ("ord") },
-  { STRING_COMMA_LEN ("eq_uq") },
-  { STRING_COMMA_LEN ("nge") },
-  { STRING_COMMA_LEN ("ngt") },
-  { STRING_COMMA_LEN ("false") },
-  { STRING_COMMA_LEN ("neq_oq") },
-  { STRING_COMMA_LEN ("ge") },
-  { STRING_COMMA_LEN ("gt") },
-  { STRING_COMMA_LEN ("true") },
-  { STRING_COMMA_LEN ("eq_os") },
-  { STRING_COMMA_LEN ("lt_oq") },
-  { STRING_COMMA_LEN ("le_oq") },
-  { STRING_COMMA_LEN ("unord_s") },
-  { STRING_COMMA_LEN ("neq_us") },
-  { STRING_COMMA_LEN ("nlt_uq") },
-  { STRING_COMMA_LEN ("nle_uq") },
-  { STRING_COMMA_LEN ("ord_s") },
-  { STRING_COMMA_LEN ("eq_us") },
-  { STRING_COMMA_LEN ("nge_uq") },
-  { STRING_COMMA_LEN ("ngt_uq") },
-  { STRING_COMMA_LEN ("false_os") },
-  { STRING_COMMA_LEN ("neq_os") },
-  { STRING_COMMA_LEN ("ge_oq") },
-  { STRING_COMMA_LEN ("gt_oq") },
-  { STRING_COMMA_LEN ("true_us") },
-};
-
 static void
-VCMP_Fixup (int bytemode ATTRIBUTE_UNUSED, int sizeflag ATTRIBUTE_UNUSED)
+OP_VexI4 (int bytemode ATTRIBUTE_UNUSED,
+         int sizeflag ATTRIBUTE_UNUSED)
 {
-  unsigned int cmp_type;
-
-  FETCH_DATA (the_info, codep + 1);
-  cmp_type = *codep++ & 0xff;
-  if (cmp_type < ARRAY_SIZE (vex_cmp_op))
-    {
-      char suffix [3];
-      char *p = mnemonicendp - 2;
-      suffix[0] = p[0];
-      suffix[1] = p[1];
-      suffix[2] = '\0';
-      sprintf (p, "%s%s", vex_cmp_op[cmp_type].name, suffix);
-      mnemonicendp += vex_cmp_op[cmp_type].len;
-    }
-  else
-    {
-      /* We have a reserved extension byte.  Output it directly.  */
-      scratchbuf[0] = '$';
-      print_operand_value (scratchbuf + 1, 1, cmp_type);
-      oappend_maybe_intel (scratchbuf);
-      scratchbuf[0] = '\0';
-    }
+  scratchbuf[0] = '$';
+  print_operand_value (scratchbuf + 1, 1, codep[-1] & 0xf);
+  oappend_maybe_intel (scratchbuf);
 }
 
 static void
@@ -16424,44 +16701,6 @@ PCLMUL_Fixup (int bytemode ATTRIBUTE_UNUSED,
     }
 }
 
-static void
-MOVBE_Fixup (int bytemode, int sizeflag)
-{
-  /* Add proper suffix to "movbe".  */
-  char *p = mnemonicendp;
-
-  switch (bytemode)
-    {
-    case v_mode:
-      if (intel_syntax)
-       goto skip;
-
-      USED_REX (REX_W);
-      if (sizeflag & SUFFIX_ALWAYS)
-       {
-         if (rex & REX_W)
-           *p++ = 'q';
-         else
-           {
-             if (sizeflag & DFLAG)
-               *p++ = 'l';
-             else
-               *p++ = 'w';
-             used_prefixes |= (prefixes & PREFIX_DATA);
-           }
-       }
-      break;
-    default:
-      oappend (INTERNAL_DISASSEMBLER_ERROR);
-      break;
-    }
-  mnemonicendp = p;
-  *p = '\0';
-
- skip:
-  OP_M (bytemode, sizeflag);
-}
-
 static void
 MOVSXD_Fixup (int bytemode, int sizeflag)
 {
@@ -16501,46 +16740,6 @@ MOVSXD_Fixup (int bytemode, int sizeflag)
   OP_E (bytemode, sizeflag);
 }
 
-static void
-OP_LWPCB_E (int bytemode ATTRIBUTE_UNUSED, int sizeflag ATTRIBUTE_UNUSED)
-{
-  int reg;
-  const char **names;
-
-  /* Skip mod/rm byte.  */
-  MODRM_CHECK;
-  codep++;
-
-  if (rex & REX_W)
-    names = names64;
-  else
-    names = names32;
-
-  reg = modrm.rm;
-  USED_REX (REX_B);
-  if (rex & REX_B)
-    reg += 8;
-
-  oappend (names[reg]);
-}
-
-static void
-OP_LWP_E (int bytemode ATTRIBUTE_UNUSED, int sizeflag ATTRIBUTE_UNUSED)
-{
-  const char **names;
-  unsigned int reg = vex.register_specifier;
-  vex.register_specifier = 0;
-
-  if (rex & REX_W)
-    names = names64;
-  else
-    names = names32;
-
-  if (address_mode != mode_64bit)
-    reg &= 7;
-  oappend (names[reg]);
-}
-
 static void
 OP_Mask (int bytemode, int sizeflag ATTRIBUTE_UNUSED)
 {
This page took 0.069153 seconds and 4 git commands to generate.