SitesBLAST – Find functional sites

 

SitesBLAST

Comparing Synpcc7942_0489 Synpcc7942_0489 aldehyde dehydrogenase to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

P30838 Aldehyde dehydrogenase, dimeric NADP-preferring; ALDHIII; Aldehyde dehydrogenase 3; Aldehyde dehydrogenase family 3 member A1; EC 1.2.1.5 from Homo sapiens (Human) (see 4 papers)
49% identity, 96% coverage: 10:448/459 of query aligns to 5:445/453 of P30838

query
sites
P30838
A
 
S
E
 
E
T
 
A
L
 
V
A
 
K
A
 
R
L
 
A
Q
 
R
A
 
A
T
 
A
F
 
F
D
 
S
R
 
S
G
 
G
D
 
R
T
 
T
R
 
R
T
 
P
L
 
L
A
 
Q
F
 
F
R
 
R
L
 
I
A
 
Q
R
 
Q
L
 
L
Q
 
E
D
 
A
L
 
L
A
 
Q
K
 
R
L
 
L
V
 
I
A
 
Q
D
 
E
N
 
Q
E
 
E
A
 
Q
E
 
E
L
 
L
L
 
V
Q
 
G
A
 
A
L
 
L
A
 
A
S
 
A
D
 
D
L
 
L
R
 
H
K
 
K
P
 
N
A
 
E
L
 
W
E
 
N
A
 
A
Y
 
Y
A
 
Y
S
 
E
E
 
E
I
 
V
Y
 
V
F
 
Y
V
 
V
R
 
L
D
 
E
Q
 
E
I
 
I
K
 
E
L
 
Y
T
 
M
C
 
I
K
 
Q
H
 
K
L
 
L
R
 
P
R
 
E
W
 
W
M
 
A
Q
 
A
P
 
D
E
 
E
K
 
P
Q
 
V
S
 
E
I
 
K
S
 
T
L
 
P
M
 
Q
Q
 
T
Q
 
Q
P
 
Q
G
 
D
Q
 
E
A
 
L
Y
 
Y
R
 
I
Q
 
H
A
 
S
E
 
E
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
L
I
 
V
I
 
I
G
 
G
P
 
T
W
 
W
N
 
N
Y
 
Y
P
 
P
F
 
F
Q
 
N
L
 
L
L
 
T
I
 
I
T
 
Q
P
 
P
L
 
M
I
 
V
G
 
G
A
 
A
I
 
I
A
 
A
A
 
A
G
 
G
N
 
N
C
x
S
A
 
V
V
 
V
L
 
L
K
 
K
P
 
P
S
 
S
E
 
E
L
 
L
A
 
S
P
 
E
A
 
N
T
 
M
S
 
A
S
 
S
L
 
L
I
 
L
Q
 
A
R
 
T
L
 
I
I
 
I
S
 
P
D
 
Q
R
 
Y
F
 
L
D
 
D
P
 
K
D
 
D
Y
 
L
I
 
Y
R
 
P
V
 
V
L
 
I
E
 
N
G
 
G
D
 
G
A
 
V
S
 
P
V
 
E
S
 
T
Q
 
T
A
 
E
L
 
L
I
 
L
T
 
K
Q
 
E
P
 
R
F
 
F
D
 
D
H
 
H
I
 
I
F
 
L
F
 
Y
T
 
T
G
 
G
G
 
S
T
 
T
A
 
G
I
 
V
G
 
G
R
 
K
K
 
I
V
 
I
M
 
M
A
 
T
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
T
L
 
L
E
|
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
C
I
 
Y
V
 
V
D
 
D
T
 
K
D
 
N
I
 
C
D
 
D
L
 
L
D
 
D
V
 
V
A
 
A
A
 
C
R
 
R
R
 
R
I
 
I
A
 
A
W
 
W
G
 
G
K
 
K
F
 
F
F
 
M
N
 
N
A
 
S
G
 
G
Q
 
Q
T
 
T
C
|
C
I
 
V
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
I
L
 
L
V
 
C
Q
 
D
R
 
P
T
 
S
V
 
I
A
 
Q
E
 
N
P
 
Q
F
 
I
I
 
V
E
 
E
A
 
K
L
 
L
I
 
K
D
 
K
N
 
S
I
 
L
Q
 
K
Q
 
E
F
 
F
Y
 
Y
G
 
G
E
 
E
D
 
D
P
 
A
Q
 
K
Q
 
K
S
 
S
A
 
R
D
 
D
Y
 
Y
A
 
G
R
 
R
I
 
I
V
 
I
S
 
S
D
 
A
R
 
R
H
 
H
W
 
F
Q
 
Q
R
 
R
L
 
V
N
 
M
S
 
G
L
 
L
L
 
I
V
 
E
D
 
G
G
 
Q
T
 
K
I
 
V
R
 
A
H
 
Y
G
 
G
G
 
G
Q
 
T
V
 
G
D
 
D
R
 
A
S
 
A
D
 
T
R
 
R
Y
 
Y
I
 
I
A
 
A
P
 
P
T
 
T
L
 
I
I
 
L
T
 
T
D
 
D
V
 
V
N
 
D
W
 
P
R
 
Q
D
 
S
P
|
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
 
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
V
L
 
L
P
 
P
I
 
I
L
 
V
I
 
C
Y
 
V
D
 
R
Q
 
S
L
 
L
D
 
E
E
 
E
A
 
A
I
 
I
A
 
Q
Q
 
F
I
 
I
R
 
N
A
 
Q
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
M
F
 
F
S
 
S
R
 
S
D
 
N
R
 
D
Q
 
K
V
 
V
Q
 
I
E
 
K
R
 
K
V
 
M
L
 
I
A
 
A
E
 
E
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
V
C
 
A
L
 
A
N
 
N
D
 
D
T
 
V
I
 
I
L
 
V
Q
 
H
V
 
I
G
 
T
V
 
L
P
 
H
D
 
S
A
 
L
A
 
P
F
 
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
N
S
 
S
G
 
G
M
 
M
G
 
G
G
 
S
Y
 
Y
H
 
H
G
 
G
K
 
K
A
 
K
S
 
S
F
 
F
E
 
E
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
R
K
 
R
L
 
S
V
 
C
L
 
L
K
 
V
R
 
R
P
 
P
F
 
L
W
 
M
L
 
N
D
 
D
-
 
E
-
 
G
L
 
L
A
 
K
L
 
V
R
 
R
Y
 
Y
P
 
P
P
 
P

4l2oA Crystal structure of human aldh3a1 with its selective inhibitor 1-(4- fluorophenyl)sulfonyl-2-methylbenzimidazole
49% identity, 96% coverage: 10:448/459 of query aligns to 4:444/446 of 4l2oA

query
sites
4l2oA
A
 
S
E
 
E
T
 
A
L
 
V
A
 
K
A
 
R
L
 
A
Q
 
R
A
 
A
T
 
A
F
 
F
D
 
S
R
 
S
G
 
G
D
 
R
T
 
T
R
 
R
T
 
P
L
 
L
A
 
Q
F
 
F
R
 
R
L
 
I
A
 
Q
R
 
Q
L
 
L
Q
 
E
D
 
A
L
 
L
A
 
Q
K
 
R
L
 
L
V
 
I
A
 
Q
D
 
E
N
 
Q
E
 
E
A
 
Q
E
 
E
L
 
L
L
 
V
Q
 
G
A
 
A
L
 
L
A
 
A
S
 
A
D
 
D
L
 
L
R
 
H
K
 
K
P
 
N
A
 
E
L
 
W
E
 
N
A
 
A
Y
 
Y
A
 
Y
S
x
E
E
 
E
I
 
V
Y
 
V
F
x
Y
V
 
V
R
 
L
D
 
E
Q
 
E
I
 
I
K
 
E
L
 
Y
T
 
M
C
 
I
K
 
Q
H
 
K
L
 
L
R
 
P
R
 
E
W
 
W
M
 
A
Q
 
A
P
 
D
E
 
E
K
 
P
Q
 
V
S
 
E
I
 
K
S
 
T
L
 
P
M
 
Q
Q
 
T
Q
 
Q
P
 
Q
G
 
D
Q
 
E
A
 
L
Y
 
Y
R
 
I
Q
 
H
A
 
S
E
 
E
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
L
I
 
V
I
 
I
G
 
G
P
x
T
W
|
W
N
|
N
Y
|
Y
P
 
P
F
 
F
Q
x
N
L
|
L
L
 
T
I
 
I
T
 
Q
P
 
P
L
 
M
I
 
V
G
 
G
A
 
A
I
 
I
A
 
A
A
 
A
G
 
G
N
 
N
C
 
A
A
 
V
V
 
V
L
 
L
K
|
K
P
 
P
S
 
S
E
|
E
L
 
L
A
 
S
P
 
E
A
 
N
T
 
M
S
 
A
S
 
S
L
 
L
I
 
L
Q
 
A
R
 
T
L
 
I
I
 
I
S
 
P
D
 
Q
R
 
Y
F
 
L
D
 
D
P
 
K
D
 
D
Y
 
L
I
 
Y
R
 
P
V
 
V
L
 
I
E
 
N
G
 
G
D
 
G
A
x
V
S
 
P
V
 
E
S
 
T
Q
 
T
A
 
E
L
 
L
I
 
L
T
 
K
Q
 
E
P
 
R
F
 
F
D
 
D
H
 
H
I
 
I
F
 
L
F
 
Y
T
|
T
G
|
G
G
x
S
T
 
T
A
 
G
I
x
V
G
 
G
R
 
K
K
 
I
V
 
I
M
 
M
A
 
T
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
T
L
 
L
E
|
E
L
|
L
G
|
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
C
I
 
Y
V
 
V
D
 
D
T
 
K
D
 
N
I
 
C
D
 
D
L
 
L
D
 
D
V
 
V
A
 
A
A
 
C
R
 
R
R
 
R
I
 
I
A
 
A
W
 
W
G
 
G
K
 
K
F
 
F
F
x
M
N
 
N
A
 
S
G
 
G
Q
 
Q
T
 
T
C
|
C
I
 
V
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
I
L
 
L
V
 
C
Q
 
D
R
 
P
T
 
S
V
 
I
A
 
Q
E
 
N
P
 
Q
F
 
I
I
 
V
E
 
E
A
 
K
L
 
L
I
 
K
D
 
K
N
 
S
I
 
L
Q
 
K
Q
 
E
F
 
F
Y
 
Y
G
 
G
E
 
E
D
 
D
P
 
A
Q
 
K
Q
 
K
S
 
S
A
 
R
D
 
D
Y
 
Y
A
 
G
R
 
R
I
 
I
V
 
I
S
 
S
D
 
A
R
 
R
H
|
H
W
 
F
Q
 
Q
R
 
R
L
 
V
N
 
M
S
 
G
L
 
L
L
 
I
V
 
E
D
 
G
G
 
Q
T
 
K
I
 
V
R
 
A
H
 
Y
G
 
G
G
 
G
Q
 
T
V
 
G
D
 
D
R
 
A
S
 
A
D
 
T
R
 
R
Y
 
Y
I
 
I
A
 
A
P
 
P
T
 
T
L
 
I
I
 
L
T
 
T
D
 
D
V
 
V
N
 
D
W
 
P
R
 
Q
D
 
S
P
 
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
|
E
I
 
I
F
|
F
G
 
G
P
 
P
L
 
V
L
 
L
P
 
P
I
 
I
L
 
V
I
 
C
Y
 
V
D
 
R
Q
 
S
L
 
L
D
 
E
E
 
E
A
 
A
I
 
I
A
 
Q
Q
 
F
I
 
I
R
 
N
A
 
Q
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
M
F
 
F
S
 
S
R
 
S
D
 
N
R
 
D
Q
 
K
V
 
V
Q
 
I
E
 
K
R
 
K
V
 
M
L
 
I
A
 
A
E
 
E
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
V
C
 
A
L
 
A
N
 
N
D
 
D
T
 
V
I
|
I
L
 
V
Q
 
H
V
x
I
G
x
T
V
 
L
P
 
H
D
 
S
A
 
L
A
 
P
F
|
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
N
S
 
S
G
 
G
M
 
M
G
 
G
G
 
S
Y
|
Y
H
|
H
G
 
G
K
 
K
A
 
K
S
 
S
F
 
F
E
 
E
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
R
K
 
R
L
 
S
V
 
C
L
 
L
K
 
V
R
 
R
P
 
P
F
 
L
W
 
M
L
 
N
D
 
D
-
 
E
-
 
G
L
 
L
A
 
K
L
 
V
R
 
R
Y
 
Y
P
 
P
P
 
P

4h80A Crystal structure of human aldh3a1 with its isozyme selective inhibitor - n-[4-(4-methylsulfonyl-2-nitroanilino)phenyl]acetamide
49% identity, 96% coverage: 10:448/459 of query aligns to 4:444/446 of 4h80A

query
sites
4h80A
A
 
S
E
 
E
T
 
A
L
 
V
A
 
K
A
 
R
L
 
A
Q
 
R
A
 
A
T
 
A
F
 
F
D
 
S
R
 
S
G
 
G
D
 
R
T
 
T
R
 
R
T
 
P
L
 
L
A
 
Q
F
 
F
R
 
R
L
 
I
A
 
Q
R
 
Q
L
 
L
Q
 
E
D
 
A
L
 
L
A
 
Q
K
 
R
L
 
L
V
 
I
A
 
Q
D
 
E
N
 
Q
E
 
E
A
 
Q
E
 
E
L
 
L
L
 
V
Q
 
G
A
 
A
L
 
L
A
 
A
S
 
A
D
 
D
L
 
L
R
 
H
K
 
K
P
 
N
A
 
E
L
 
W
E
 
N
A
 
A
Y
 
Y
A
 
Y
S
x
E
E
 
E
I
 
V
Y
 
V
F
x
Y
V
 
V
R
 
L
D
 
E
Q
 
E
I
 
I
K
 
E
L
 
Y
T
 
M
C
 
I
K
 
Q
H
 
K
L
 
L
R
 
P
R
 
E
W
 
W
M
 
A
Q
 
A
P
 
D
E
 
E
K
 
P
Q
 
V
S
 
E
I
 
K
S
 
T
L
 
P
M
 
Q
Q
 
T
Q
 
Q
P
 
Q
G
 
D
Q
 
E
A
 
L
Y
 
Y
R
 
I
Q
 
H
A
 
S
E
 
E
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
L
I
 
V
I
 
I
G
 
G
P
 
T
W
 
W
N
|
N
Y
|
Y
P
 
P
F
 
F
Q
x
N
L
 
L
L
 
T
I
 
I
T
 
Q
P
 
P
L
 
M
I
 
V
G
 
G
A
 
A
I
 
I
A
 
A
A
 
A
G
 
G
N
 
N
C
 
A
A
 
V
V
 
V
L
 
L
K
|
K
P
 
P
S
 
S
E
 
E
L
 
L
A
 
S
P
 
E
A
 
N
T
 
M
S
 
A
S
 
S
L
 
L
I
 
L
Q
 
A
R
 
T
L
 
I
I
 
I
S
 
P
D
 
Q
R
 
Y
F
 
L
D
 
D
P
 
K
D
 
D
Y
 
L
I
 
Y
R
 
P
V
 
V
L
 
I
E
 
N
G
 
G
D
 
G
A
 
V
S
 
P
V
 
E
S
 
T
Q
 
T
A
 
E
L
 
L
I
 
L
T
 
K
Q
 
E
P
 
R
F
 
F
D
 
D
H
 
H
I
 
I
F
 
L
F
 
Y
T
 
T
G
 
G
G
 
S
T
 
T
A
 
G
I
 
V
G
 
G
R
 
K
K
 
I
V
 
I
M
 
M
A
 
T
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
T
L
 
L
E
|
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
C
I
 
Y
V
 
V
D
 
D
T
 
K
D
 
N
I
 
C
D
 
D
L
 
L
D
 
D
V
 
V
A
 
A
A
 
C
R
 
R
R
 
R
I
 
I
A
 
A
W
|
W
G
 
G
K
 
K
F
 
F
F
 
M
N
 
N
A
 
S
G
 
G
Q
 
Q
T
|
T
C
|
C
I
x
V
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
I
L
 
L
V
 
C
Q
 
D
R
 
P
T
 
S
V
 
I
A
 
Q
E
 
N
P
 
Q
F
 
I
I
 
V
E
 
E
A
 
K
L
 
L
I
 
K
D
 
K
N
 
S
I
 
L
Q
 
K
Q
 
E
F
 
F
Y
 
Y
G
 
G
E
 
E
D
 
D
P
 
A
Q
 
K
Q
 
K
S
 
S
A
 
R
D
 
D
Y
 
Y
A
 
G
R
 
R
I
 
I
V
 
I
S
 
S
D
 
A
R
 
R
H
 
H
W
 
F
Q
 
Q
R
 
R
L
 
V
N
 
M
S
 
G
L
 
L
L
 
I
V
 
E
D
 
G
G
 
Q
T
 
K
I
 
V
R
 
A
H
 
Y
G
 
G
G
 
G
Q
 
T
V
 
G
D
 
D
R
 
A
S
 
A
D
 
T
R
 
R
Y
 
Y
I
 
I
A
 
A
P
 
P
T
 
T
L
 
I
I
 
L
T
 
T
D
 
D
V
 
V
N
 
D
W
 
P
R
 
Q
D
 
S
P
 
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
|
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
V
L
 
L
P
 
P
I
 
I
L
 
V
I
 
C
Y
 
V
D
 
R
Q
 
S
L
 
L
D
 
E
E
 
E
A
 
A
I
 
I
A
 
Q
Q
 
F
I
 
I
R
 
N
A
 
Q
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
M
F
 
F
S
 
S
R
 
S
D
 
N
R
 
D
Q
 
K
V
 
V
Q
 
I
E
 
K
R
 
K
V
 
M
L
 
I
A
 
A
E
 
E
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
V
C
 
A
L
 
A
N
 
N
D
 
D
T
 
V
I
 
I
L
 
V
Q
 
H
V
x
I
G
x
T
V
 
L
P
 
H
D
 
S
A
 
L
A
 
P
F
|
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
N
S
 
S
G
 
G
M
 
M
G
 
G
G
 
S
Y
|
Y
H
 
H
G
 
G
K
 
K
A
 
K
S
 
S
F
 
F
E
 
E
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
R
K
 
R
L
 
S
V
 
C
L
 
L
K
 
V
R
 
R
P
 
P
F
 
L
W
 
M
L
 
N
D
 
D
-
 
E
-
 
G
L
 
L
A
 
K
L
 
V
R
 
R
Y
 
Y
P
 
P
P
 
P

3szbA Crystal structure of human aldh3a1 modified with the beta-elimination product of aldi-1; 1-phenyl- 2-propen-1-one (see paper)
49% identity, 96% coverage: 10:448/459 of query aligns to 4:444/447 of 3szbA

query
sites
3szbA
A
 
S
E
 
E
T
 
A
L
 
V
A
 
K
A
 
R
L
 
A
Q
 
R
A
 
A
T
 
A
F
 
F
D
 
S
R
 
S
G
 
G
D
 
R
T
 
T
R
 
R
T
 
P
L
 
L
A
 
Q
F
 
F
R
 
R
L
 
I
A
 
Q
R
 
Q
L
 
L
Q
 
E
D
 
A
L
 
L
A
 
Q
K
 
R
L
 
L
V
 
I
A
 
Q
D
 
E
N
 
Q
E
 
E
A
 
Q
E
 
E
L
 
L
L
 
V
Q
 
G
A
 
A
L
 
L
A
 
A
S
 
A
D
 
D
L
 
L
R
 
H
K
 
K
P
 
N
A
 
E
L
 
W
E
 
N
A
 
A
Y
 
Y
A
 
Y
S
 
E
E
 
E
I
 
V
Y
 
V
F
 
Y
V
 
V
R
 
L
D
 
E
Q
 
E
I
 
I
K
 
E
L
 
Y
T
 
M
C
 
I
K
 
Q
H
 
K
L
 
L
R
 
P
R
 
E
W
 
W
M
 
A
Q
 
A
P
 
D
E
 
E
K
 
P
Q
 
V
S
 
E
I
 
K
S
 
T
L
 
P
M
 
Q
Q
 
T
Q
 
Q
P
 
Q
G
 
D
Q
 
E
A
 
L
Y
 
Y
R
 
I
Q
 
H
A
 
S
E
 
E
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
L
I
 
V
I
 
I
G
 
G
P
 
T
W
 
W
N
|
N
Y
|
Y
P
 
P
F
 
F
Q
 
N
L
|
L
L
 
T
I
 
I
T
 
Q
P
 
P
L
 
M
I
 
V
G
 
G
A
 
A
I
 
I
A
 
A
A
 
A
G
 
G
N
 
N
C
 
A
A
 
V
V
 
V
L
 
L
K
|
K
P
 
P
S
 
S
E
 
E
L
 
L
A
 
S
P
 
E
A
 
N
T
 
M
S
 
A
S
 
S
L
 
L
I
 
L
Q
 
A
R
 
T
L
 
I
I
 
I
S
 
P
D
 
Q
R
 
Y
F
 
L
D
 
D
P
 
K
D
 
D
Y
 
L
I
 
Y
R
 
P
V
 
V
L
 
I
E
 
N
G
 
G
D
 
G
A
 
V
S
 
P
V
 
E
S
 
T
Q
 
T
A
 
E
L
 
L
I
 
L
T
 
K
Q
 
E
P
 
R
F
 
F
D
 
D
H
 
H
I
 
I
F
 
L
F
 
Y
T
 
T
G
 
G
G
 
S
T
 
T
A
 
G
I
 
V
G
 
G
R
 
K
K
 
I
V
 
I
M
 
M
A
 
T
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
T
L
 
L
E
|
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
C
I
 
Y
V
 
V
D
 
D
T
 
K
D
 
N
I
 
C
D
 
D
L
 
L
D
 
D
V
 
V
A
 
A
A
 
C
R
 
R
R
 
R
I
 
I
A
 
A
W
 
W
G
 
G
K
 
K
F
 
F
F
 
M
N
 
N
A
 
S
G
 
G
Q
 
Q
T
 
T
C
|
C
I
 
V
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
I
L
 
L
V
 
C
Q
 
D
R
 
P
T
 
S
V
 
I
A
 
Q
E
 
N
P
 
Q
F
 
I
I
 
V
E
 
E
A
 
K
L
 
L
I
 
K
D
 
K
N
 
S
I
 
L
Q
 
K
Q
 
E
F
 
F
Y
 
Y
G
 
G
E
 
E
D
 
D
P
 
A
Q
 
K
Q
 
K
S
 
S
A
 
R
D
 
D
Y
 
Y
A
 
G
R
 
R
I
 
I
V
 
I
S
 
S
D
 
A
R
 
R
H
 
H
W
 
F
Q
 
Q
R
 
R
L
 
V
N
 
M
S
 
G
L
 
L
L
 
I
V
 
E
D
 
G
G
 
Q
T
 
K
I
 
V
R
 
A
H
 
Y
G
 
G
G
 
G
Q
 
T
V
 
G
D
 
D
R
 
A
S
 
A
D
 
T
R
 
R
Y
 
Y
I
 
I
A
 
A
P
 
P
T
 
T
L
 
I
I
 
L
T
 
T
D
 
D
V
 
V
N
 
D
W
 
P
R
 
Q
D
 
S
P
 
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
|
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
V
L
 
L
P
 
P
I
 
I
L
 
V
I
 
C
Y
 
V
D
 
R
Q
 
S
L
 
L
D
 
E
E
 
E
A
 
A
I
 
I
A
 
Q
Q
 
F
I
 
I
R
 
N
A
 
Q
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
M
F
 
F
S
 
S
R
 
S
D
 
N
R
 
D
Q
 
K
V
 
V
Q
 
I
E
 
K
R
 
K
V
 
M
L
 
I
A
 
A
E
 
E
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
V
C
 
A
L
 
A
N
 
N
D
 
D
T
 
V
I
 
I
L
 
V
Q
 
H
V
x
I
G
 
T
V
 
L
P
 
H
D
 
S
A
 
L
A
 
P
F
 
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
N
S
 
S
G
 
G
M
 
M
G
 
G
G
 
S
Y
|
Y
H
 
H
G
 
G
K
 
K
A
 
K
S
 
S
F
 
F
E
 
E
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
R
K
 
R
L
 
S
V
 
C
L
 
L
K
 
V
R
 
R
P
 
P
F
 
L
W
 
M
L
 
N
D
 
D
-
 
E
-
 
G
L
 
L
A
 
K
L
 
V
R
 
R
Y
 
Y
P
 
P
P
 
P

8bb8A Crystal structure of human aldehyde dehydrogenase aldh3a1 in complex with octanal (see paper)
49% identity, 96% coverage: 10:448/459 of query aligns to 4:444/447 of 8bb8A

query
sites
8bb8A
A
 
S
E
 
E
T
 
A
L
 
V
A
 
K
A
 
R
L
 
A
Q
 
R
A
 
A
T
 
A
F
 
F
D
 
S
R
 
S
G
 
G
D
 
R
T
 
T
R
 
R
T
 
P
L
 
L
A
 
Q
F
 
F
R
 
R
L
 
I
A
 
Q
R
 
Q
L
 
L
Q
 
E
D
 
A
L
 
L
A
 
Q
K
 
R
L
 
L
V
 
I
A
 
Q
D
 
E
N
 
Q
E
 
E
A
 
Q
E
 
E
L
 
L
L
 
V
Q
 
G
A
 
A
L
 
L
A
 
A
S
 
A
D
 
D
L
 
L
R
 
H
K
 
K
P
 
N
A
 
E
L
 
W
E
 
N
A
 
A
Y
 
Y
A
 
Y
S
 
E
E
 
E
I
 
V
Y
 
V
F
x
Y
V
 
V
R
 
L
D
 
E
Q
 
E
I
 
I
K
 
E
L
 
Y
T
 
M
C
 
I
K
 
Q
H
 
K
L
 
L
R
 
P
R
 
E
W
 
W
M
 
A
Q
 
A
P
 
D
E
 
E
K
 
P
Q
 
V
S
 
E
I
 
K
S
 
T
L
 
P
M
 
Q
Q
 
T
Q
 
Q
P
 
Q
G
 
D
Q
 
E
A
 
L
Y
 
Y
R
 
I
Q
 
H
A
 
S
E
 
E
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
L
I
 
V
I
 
I
G
 
G
P
 
T
W
 
W
N
 
N
Y
|
Y
P
 
P
F
 
F
Q
x
N
L
 
L
L
 
T
I
 
I
T
 
Q
P
 
P
L
 
M
I
 
V
G
 
G
A
 
A
I
 
I
A
 
A
A
 
A
G
 
G
N
 
N
C
 
S
A
 
V
V
 
V
L
 
L
K
 
K
P
 
P
S
 
S
E
 
E
L
 
L
A
 
S
P
 
E
A
 
N
T
 
M
S
 
A
S
 
S
L
 
L
I
 
L
Q
 
A
R
 
T
L
 
I
I
 
I
S
 
P
D
 
Q
R
 
Y
F
 
L
D
 
D
P
 
K
D
 
D
Y
 
L
I
 
Y
R
 
P
V
 
V
L
 
I
E
 
N
G
 
G
D
 
G
A
 
V
S
 
P
V
 
E
S
 
T
Q
 
T
A
 
E
L
 
L
I
 
L
T
 
K
Q
 
E
P
 
R
F
 
F
D
 
D
H
 
H
I
 
I
F
 
L
F
 
Y
T
 
T
G
 
G
G
 
S
T
 
T
A
 
G
I
 
V
G
 
G
R
 
K
K
 
I
V
 
I
M
 
M
A
 
T
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
T
L
 
L
E
 
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
C
I
 
Y
V
 
V
D
 
D
T
 
K
D
 
N
I
 
C
D
 
D
L
 
L
D
 
D
V
 
V
A
 
A
A
 
C
R
 
R
R
 
R
I
 
I
A
 
A
W
 
W
G
 
G
K
 
K
F
 
F
F
 
M
N
 
N
A
 
S
G
 
G
Q
 
Q
T
 
T
C
|
C
I
 
V
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
I
L
 
L
V
 
C
Q
 
D
R
 
P
T
 
S
V
 
I
A
 
Q
E
 
N
P
 
Q
F
 
I
I
 
V
E
 
E
A
 
K
L
 
L
I
 
K
D
 
K
N
 
S
I
 
L
Q
 
K
Q
 
E
F
 
F
Y
 
Y
G
 
G
E
 
E
D
 
D
P
 
A
Q
 
K
Q
 
K
S
 
S
A
 
R
D
 
D
Y
 
Y
A
 
G
R
 
R
I
 
I
V
 
I
S
 
S
D
 
A
R
 
R
H
 
H
W
 
F
Q
 
Q
R
 
R
L
 
V
N
 
M
S
 
G
L
 
L
L
 
I
V
 
E
D
 
G
G
 
Q
T
 
K
I
 
V
R
 
A
H
 
Y
G
 
G
G
 
G
Q
 
T
V
 
G
D
 
D
R
 
A
S
 
A
D
 
T
R
 
R
Y
 
Y
I
 
I
A
 
A
P
 
P
T
 
T
L
 
I
I
 
L
T
 
T
D
 
D
V
 
V
N
 
D
W
 
P
R
 
Q
D
 
S
P
 
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
 
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
V
L
 
L
P
 
P
I
 
I
L
 
V
I
 
C
Y
 
V
D
 
R
Q
 
S
L
 
L
D
 
E
E
 
E
A
 
A
I
 
I
A
 
Q
Q
 
F
I
 
I
R
 
N
A
 
Q
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
M
F
 
F
S
 
S
R
 
S
D
 
N
R
 
D
Q
 
K
V
 
V
Q
 
I
E
 
K
R
 
K
V
 
M
L
 
I
A
 
A
E
 
E
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
V
C
 
A
L
 
A
N
 
N
D
 
D
T
 
V
I
 
I
L
 
V
Q
 
H
V
x
I
G
x
T
V
 
L
P
 
H
D
 
S
A
 
L
A
 
P
F
 
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
N
S
 
S
G
 
G
M
 
M
G
 
G
G
 
S
Y
 
Y
H
|
H
G
 
G
K
 
K
A
 
K
S
 
S
F
 
F
E
 
E
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
R
K
 
R
L
 
S
V
 
C
L
 
L
K
 
V
R
 
R
P
 
P
F
 
L
W
 
M
L
 
N
D
 
D
-
 
E
-
 
G
L
 
L
A
 
K
L
 
V
R
 
R
Y
 
Y
P
 
P
P
 
P

4l1oB Crystal structure of human aldh3a1 with inhibitor 1-{[4-(1,3- benzodioxol-5-ylmethyl)piperazin-1-yl]methyl}-1h-indole-2,3-dione
49% identity, 96% coverage: 10:448/459 of query aligns to 4:444/452 of 4l1oB

query
sites
4l1oB
A
 
S
E
 
E
T
 
A
L
 
V
A
 
K
A
 
R
L
 
A
Q
 
R
A
 
A
T
 
A
F
 
F
D
 
S
R
 
S
G
 
G
D
 
R
T
 
T
R
 
R
T
 
P
L
 
L
A
 
Q
F
 
F
R
 
R
L
 
I
A
 
Q
R
 
Q
L
 
L
Q
 
E
D
 
A
L
 
L
A
 
Q
K
 
R
L
 
L
V
 
I
A
 
Q
D
 
E
N
 
Q
E
 
E
A
 
Q
E
 
E
L
 
L
L
 
V
Q
 
G
A
 
A
L
 
L
A
 
A
S
 
A
D
 
D
L
 
L
R
 
H
K
 
K
P
 
N
A
 
E
L
 
W
E
 
N
A
 
A
Y
 
Y
A
 
Y
S
 
E
E
 
E
I
 
V
Y
 
V
F
 
Y
V
 
V
R
 
L
D
 
E
Q
 
E
I
 
I
K
 
E
L
 
Y
T
 
M
C
 
I
K
 
Q
H
 
K
L
 
L
R
 
P
R
 
E
W
 
W
M
 
A
Q
 
A
P
 
D
E
 
E
K
 
P
Q
 
V
S
 
E
I
 
K
S
 
T
L
 
P
M
 
Q
Q
 
T
Q
 
Q
P
 
Q
G
 
D
Q
 
E
A
 
L
Y
 
Y
R
 
I
Q
 
H
A
 
S
E
 
E
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
L
I
 
V
I
 
I
G
 
G
P
 
T
W
 
W
N
|
N
Y
|
Y
P
 
P
F
 
F
Q
x
N
L
|
L
L
 
T
I
 
I
T
 
Q
P
 
P
L
 
M
I
 
V
G
 
G
A
 
A
I
 
I
A
 
A
A
 
A
G
 
G
N
 
N
C
 
A
A
 
V
V
 
V
L
 
L
K
|
K
P
 
P
S
 
S
E
 
E
L
 
L
A
 
S
P
 
E
A
 
N
T
 
M
S
 
A
S
 
S
L
 
L
I
 
L
Q
 
A
R
 
T
L
 
I
I
 
I
S
 
P
D
 
Q
R
 
Y
F
 
L
D
 
D
P
 
K
D
 
D
Y
 
L
I
 
Y
R
 
P
V
 
V
L
 
I
E
 
N
G
 
G
D
 
G
A
 
V
S
 
P
V
 
E
S
 
T
Q
 
T
A
 
E
L
 
L
I
 
L
T
 
K
Q
 
E
P
 
R
F
 
F
D
 
D
H
 
H
I
 
I
F
 
L
F
 
Y
T
 
T
G
 
G
G
 
S
T
 
T
A
 
G
I
 
V
G
 
G
R
 
K
K
 
I
V
 
I
M
 
M
A
 
T
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
T
L
 
L
E
|
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
C
I
 
Y
V
 
V
D
 
D
T
 
K
D
 
N
I
 
C
D
 
D
L
 
L
D
 
D
V
 
V
A
 
A
A
 
C
R
 
R
R
 
R
I
 
I
A
 
A
W
 
W
G
 
G
K
 
K
F
 
F
F
 
M
N
 
N
A
 
S
G
 
G
Q
 
Q
T
|
T
C
|
C
I
 
V
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
I
L
 
L
V
 
C
Q
 
D
R
 
P
T
 
S
V
 
I
A
 
Q
E
 
N
P
 
Q
F
 
I
I
 
V
E
 
E
A
 
K
L
 
L
I
 
K
D
 
K
N
 
S
I
 
L
Q
 
K
Q
 
E
F
 
F
Y
 
Y
G
 
G
E
 
E
D
 
D
P
 
A
Q
 
K
Q
 
K
S
 
S
A
 
R
D
 
D
Y
 
Y
A
 
G
R
 
R
I
 
I
V
 
I
S
 
S
D
 
A
R
 
R
H
 
H
W
 
F
Q
 
Q
R
 
R
L
 
V
N
 
M
S
 
G
L
 
L
L
 
I
V
 
E
D
 
G
G
 
Q
T
 
K
I
 
V
R
 
A
H
 
Y
G
 
G
G
 
G
Q
 
T
V
 
G
D
 
D
R
 
A
S
 
A
D
 
T
R
 
R
Y
 
Y
I
 
I
A
 
A
P
 
P
T
 
T
L
 
I
I
 
L
T
 
T
D
 
D
V
 
V
N
 
D
W
 
P
R
 
Q
D
 
S
P
 
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
|
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
V
L
 
L
P
 
P
I
 
I
L
 
V
I
 
C
Y
 
V
D
 
R
Q
 
S
L
 
L
D
 
E
E
 
E
A
 
A
I
 
I
A
 
Q
Q
 
F
I
 
I
R
 
N
A
 
Q
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
M
F
 
F
S
 
S
R
 
S
D
 
N
R
 
D
Q
 
K
V
 
V
Q
 
I
E
 
K
R
 
K
V
 
M
L
 
I
A
 
A
E
 
E
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
V
C
 
A
L
 
A
N
 
N
D
 
D
T
 
V
I
|
I
L
 
V
Q
 
H
V
x
I
G
 
T
V
 
L
P
 
H
D
 
S
A
 
L
A
 
P
F
|
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
N
S
 
S
G
 
G
M
 
M
G
 
G
G
 
S
Y
|
Y
H
|
H
G
 
G
K
 
K
A
 
K
S
 
S
F
 
F
E
 
E
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
R
K
 
R
L
 
S
V
 
C
L
 
L
K
 
V
R
 
R
P
 
P
F
 
L
W
 
M
L
 
N
D
 
D
-
 
E
-
 
G
L
 
L
A
 
K
L
 
V
R
 
R
Y
 
Y
P
 
P
P
 
P

1ad3A Class 3 aldehyde dehydrogenase complex with nicotinamide-adenine- dinucleotide (see paper)
48% identity, 96% coverage: 10:448/459 of query aligns to 3:443/446 of 1ad3A

query
sites
1ad3A
A
 
S
E
 
D
T
 
T
L
 
V
A
 
K
A
 
R
L
 
A
Q
 
R
A
 
E
T
 
A
F
 
F
D
 
N
R
 
S
G
 
G
D
 
K
T
 
T
R
 
R
T
 
S
L
 
L
A
 
Q
F
 
F
R
 
R
L
 
I
A
 
Q
R
 
Q
L
 
L
Q
 
E
D
 
A
L
 
L
A
 
Q
K
 
R
L
 
M
V
 
I
A
 
N
D
 
E
N
 
N
E
 
L
A
 
K
E
 
S
L
 
I
L
 
S
Q
 
G
A
 
A
L
 
L
A
 
A
S
 
S
D
 
D
L
 
L
R
 
G
K
 
K
P
 
N
A
 
E
L
 
W
E
 
T
A
 
S
Y
 
Y
A
 
Y
S
 
E
E
 
E
I
 
V
Y
 
A
F
 
H
V
 
V
R
 
L
D
 
E
Q
 
E
I
 
L
K
 
D
L
 
T
T
 
T
C
 
I
K
 
K
H
 
E
L
 
L
R
 
P
R
 
D
W
 
W
M
 
A
Q
 
E
P
 
D
E
 
E
K
 
P
Q
 
V
S
 
A
I
 
K
S
 
T
L
 
R
M
 
Q
Q
 
T
Q
 
Q
P
 
Q
G
 
D
Q
 
D
A
 
L
Y
 
Y
R
 
I
Q
 
H
A
 
S
E
 
E
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
L
I
 
V
I
 
I
G
 
G
P
x
A
W
|
W
N
|
N
Y
 
Y
P
 
P
F
 
F
Q
 
N
L
 
L
L
 
T
I
 
I
T
 
Q
P
 
P
L
 
M
I
 
V
G
 
G
A
 
A
I
 
V
A
 
A
A
 
A
G
 
G
N
 
N
C
 
A
A
 
V
V
 
I
L
 
L
K
|
K
P
 
P
S
 
S
E
|
E
L
x
V
A
 
S
P
 
G
A
 
H
T
 
M
S
 
A
S
 
D
L
 
L
I
 
L
Q
 
A
R
 
T
L
 
L
I
 
I
S
 
P
D
 
Q
R
 
Y
F
 
M
D
 
D
P
 
Q
D
 
N
Y
 
L
I
 
Y
R
 
L
V
 
V
L
 
V
E
 
K
G
 
G
D
 
G
A
x
V
S
 
P
V
 
E
S
 
T
Q
 
T
A
 
E
L
 
L
I
 
L
T
 
K
Q
 
E
P
 
R
F
 
F
D
 
D
H
 
H
I
 
I
F
 
M
F
 
Y
T
 
T
G
|
G
G
 
S
T
 
T
A
 
A
I
x
V
G
 
G
R
 
K
K
 
I
V
 
V
M
 
M
A
 
A
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
T
L
 
L
E
|
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
C
I
 
Y
V
 
V
D
 
D
T
 
K
D
 
D
I
 
C
D
 
D
L
 
L
D
 
D
V
 
V
A
 
A
A
 
C
R
 
R
R
 
R
I
 
I
A
 
A
W
 
W
G
 
G
K
 
K
F
 
F
F
 
M
N
 
N
A
 
S
G
 
G
Q
 
Q
T
 
T
C
|
C
I
 
V
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
I
L
 
L
V
 
C
Q
 
D
R
 
P
T
 
S
V
 
I
A
 
Q
E
 
N
P
 
Q
F
 
I
I
 
V
E
 
E
A
 
K
L
 
L
I
 
K
D
 
K
N
 
S
I
 
L
Q
 
K
Q
 
D
F
 
F
Y
 
Y
G
 
G
E
 
E
D
 
D
P
 
A
Q
 
K
Q
 
Q
S
 
S
A
 
R
D
 
D
Y
 
Y
A
 
G
R
 
R
I
 
I
V
 
I
S
 
N
D
 
D
R
 
R
H
|
H
W
 
F
Q
 
Q
R
|
R
L
 
V
N
 
K
S
 
G
L
 
L
L
 
I
V
 
D
D
 
N
G
 
Q
T
 
K
I
 
V
R
 
A
H
 
H
G
 
G
G
 
G
Q
 
T
V
 
W
D
 
D
R
 
Q
S
 
S
D
 
S
R
 
R
Y
 
Y
I
 
I
A
 
A
P
 
P
T
 
T
L
 
I
I
 
L
T
 
V
D
 
D
V
 
V
N
 
D
W
 
P
R
 
Q
D
 
S
P
 
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
|
E
I
 
I
F
|
F
G
 
G
P
 
P
L
 
V
L
 
M
P
 
P
I
 
I
L
 
V
I
 
C
Y
 
V
D
 
R
Q
 
S
L
 
L
D
 
E
E
 
E
A
 
A
I
 
I
A
 
Q
Q
 
F
I
 
I
R
 
N
A
 
Q
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
V
F
 
F
S
 
S
R
 
N
D
 
N
R
 
E
Q
 
K
V
 
V
Q
 
I
E
 
K
R
 
K
V
 
M
L
 
I
A
 
A
E
 
E
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
V
C
 
T
L
 
A
N
 
N
D
 
D
T
 
V
I
 
I
L
 
V
Q
 
H
V
 
I
G
 
T
V
 
V
P
 
P
D
 
T
A
 
L
A
 
P
F
 
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
N
S
 
S
G
 
G
M
 
M
G
 
G
G
 
A
Y
|
Y
H
 
H
G
 
G
K
 
K
A
 
K
S
 
S
F
 
F
E
 
E
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
R
K
 
R
L
 
S
V
 
C
L
 
L
K
 
V
R
 
K
P
 
S
F
 
L
W
 
L
L
 
N
D
 
E
L
 
E
A
 
A
-
 
H
-
 
K
L
 
A
R
 
R
Y
 
Y
P
 
P
P
 
P

Q70DU8 Aldehyde dehydrogenase family 3 member H1; AtALDH4; Ath-ALDH4; EC 1.2.1.3 from Arabidopsis thaliana (Mouse-ear cress) (see 2 papers)
48% identity, 98% coverage: 9:459/459 of query aligns to 12:468/484 of Q70DU8

query
sites
Q70DU8
A
 
A
A
 
S
E
 
N
T
 
L
L
 
V
A
 
T
A
 
E
L
 
L
Q
 
R
A
 
R
T
 
S
F
 
F
D
 
D
R
 
D
G
 
G
D
 
V
T
 
T
R
 
R
T
 
G
L
 
Y
A
 
E
F
 
W
R
 
R
L
 
V
A
 
T
R
 
Q
L
 
L
Q
 
K
D
 
K
L
 
L
A
 
M
K
 
I
L
 
I
V
x
C
A
 
D
D
 
N
N
 
H
E
 
E
A
 
P
E
 
E
L
 
I
L
 
V
Q
 
A
A
 
A
L
 
L
A
 
R
S
 
D
D
 
D
L
 
L
R
 
G
K
 
K
P
 
P
A
 
E
L
 
L
E
 
E
A
 
S
Y
 
S
A
 
V
S
 
Y
E
 
E
I
 
V
Y
 
S
F
 
L
V
 
L
R
 
R
D
 
N
Q
 
S
I
 
I
K
 
K
L
 
L
T
 
A
C
 
L
K
 
K
H
 
Q
L
 
L
R
 
K
R
 
N
W
 
W
M
 
M
Q
 
A
P
 
P
E
 
E
K
 
K
Q
 
A
S
 
K
I
 
T
S
 
S
L
 
L
M
 
T
Q
 
T
Q
 
F
P
 
P
G
 
A
Q
 
S
A
 
A
Y
 
E
R
 
I
Q
 
V
A
 
S
E
 
E
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
L
I
 
V
I
 
I
G
 
S
P
 
A
W
 
W
N
 
N
Y
 
Y
P
 
P
F
 
F
Q
 
L
L
 
L
L
 
S
I
 
I
T
 
D
P
 
P
L
 
V
I
 
I
G
 
G
A
 
A
I
 
I
A
 
S
A
 
A
G
 
G
N
 
N
C
 
A
A
 
V
V
 
V
L
 
L
K
 
K
P
 
P
S
 
S
E
|
E
L
 
L
A
 
A
P
 
P
A
 
A
T
 
S
S
 
S
S
 
A
L
 
L
I
 
L
Q
 
T
R
 
K
L
 
L
I
 
L
S
 
E
D
 
Q
R
 
Y
F
 
L
D
 
D
P
 
P
D
 
S
Y
 
A
I
 
V
R
 
R
V
 
V
L
 
V
E
 
E
G
 
G
D
 
A
A
x
V
S
 
T
V
 
E
S
 
T
Q
 
S
A
 
A
L
 
L
I
 
L
T
 
E
Q
 
Q
P
 
K
F
 
W
D
 
D
H
 
K
I
 
I
F
 
F
F
 
Y
T
 
T
G
 
G
G
 
S
T
 
S
A
 
K
I
|
I
G
 
G
R
 
R
K
 
V
V
 
I
M
 
M
A
 
A
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
V
L
 
L
E
 
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
V
I
 
V
V
 
V
D
 
D
T
 
S
D
 
D
I
 
T
D
 
D
L
 
L
D
 
K
V
 
V
A
 
T
A
 
V
R
 
R
R
 
R
I
 
I
A
 
I
W
 
V
G
 
G
K
 
K
F
 
W
-
 
G
F
x
C
N
 
N
A
 
N
G
 
G
Q
 
Q
T
 
A
C
|
C
I
 
V
A
 
S
P
 
P
D
 
D
Y
 
Y
L
 
I
L
 
L
V
 
T
Q
 
T
R
 
K
T
 
E
V
 
Y
A
 
A
E
 
P
P
 
K
F
 
L
I
 
I
E
 
D
A
 
A
L
 
M
I
 
K
D
 
L
N
 
E
I
 
L
Q
 
E
Q
 
K
F
 
F
Y
 
Y
G
 
G
E
 
K
D
 
N
P
 
P
Q
 
I
Q
 
E
S
 
S
A
 
K
D
 
D
Y
 
M
A
 
S
R
 
R
I
 
I
V
 
V
S
 
N
D
 
S
R
 
N
H
 
H
W
 
F
Q
 
D
R
 
R
L
 
L
N
 
S
S
 
K
L
 
L
L
 
L
-
 
D
-
 
E
-
 
K
-
 
E
V
 
V
D
 
S
G
 
D
T
 
K
I
 
I
R
 
V
H
 
Y
G
 
G
G
 
G
Q
 
E
V
 
K
D
 
D
R
 
R
S
 
E
D
 
N
R
 
L
Y
 
K
I
 
I
A
 
A
P
 
P
T
 
T
L
 
I
I
 
L
T
 
L
D
 
D
V
 
V
N
 
P
W
 
L
R
 
D
D
 
S
P
 
L
I
 
I
L
 
M
Q
 
S
E
 
E
E
 
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
L
L
 
L
P
 
P
I
 
I
L
 
L
I
 
T
Y
 
L
D
 
N
Q
 
N
L
 
L
D
 
E
E
 
E
A
 
S
I
 
F
A
 
D
Q
 
V
I
 
I
R
 
R
A
 
S
Q
 
R
P
 
P
K
 
K
P
 
P
L
 
L
A
 
A
L
 
A
Y
 
Y
L
 
L
F
 
F
S
 
T
R
 
H
D
 
N
R
 
K
Q
 
K
V
 
L
Q
 
K
E
 
E
R
 
R
V
 
F
L
 
A
A
 
A
E
 
T
T
 
V
S
 
S
A
 
A
G
 
G
S
 
G
V
 
I
C
 
V
L
 
V
N
 
N
D
 
D
T
 
I
I
 
A
L
 
V
Q
 
H
V
 
L
G
 
A
V
 
L
P
 
H
D
 
T
A
 
L
A
 
P
F
 
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
E
S
 
S
G
 
G
M
 
M
G
 
G
G
 
A
Y
 
Y
H
 
H
G
 
G
K
 
K
A
 
F
S
 
S
F
 
F
E
 
D
T
 
A
F
 
F
S
 
S
H
 
H
Y
 
K
K
 
K
L
 
A
V
 
V
L
 
L
K
 
Y
R
 
R
P
 
S
F
 
L
W
 
F
L
 
G
D
 
D
L
 
S
A
 
A
L
 
V
R
 
R
Y
 
Y
P
 
P
P
 
P
Y
 
Y
G
 
S
-
 
R
D
 
G
K
 
K
I
 
L
N
 
R
L
 
L
F
 
L
R
 
K
K
 
A
L
 
L

Q80VQ0 Aldehyde dehydrogenase family 3 member B1; Aldehyde dehydrogenase 7; EC 1.2.1.28; EC 1.2.1.5; EC 1.2.1.7 from Mus musculus (Mouse) (see paper)
47% identity, 96% coverage: 11:452/459 of query aligns to 6:449/468 of Q80VQ0

query
sites
Q80VQ0
E
 
D
T
 
K
L
 
L
A
 
Q
A
 
Q
L
 
L
Q
 
R
A
 
E
T
 
A
F
 
F
D
 
K
R
 
E
G
 
G
D
 
R
T
 
T
R
 
R
T
 
S
L
 
A
A
 
E
F
 
F
R
 
R
L
 
A
A
 
A
R
 
Q
L
 
L
Q
 
Q
D
 
G
L
 
L
A
 
S
K
 
H
L
 
F
V
 
L
A
 
R
D
 
D
N
 
N
E
 
K
A
 
Q
E
 
Q
L
 
L
L
 
Q
Q
 
E
A
 
A
L
 
L
A
 
A
S
 
Q
D
 
D
L
 
L
R
 
H
K
 
K
P
 
S
A
 
A
L
 
F
E
 
E
A
 
A
Y
 
E
A
 
V
S
 
S
E
 
E
I
 
I
Y
 
A
F
 
I
V
 
S
R
 
Q
D
 
A
Q
 
E
I
 
V
K
 
D
L
 
L
T
 
A
C
 
L
K
 
R
H
 
N
L
 
L
R
 
R
R
 
S
W
 
W
M
 
M
Q
 
K
P
 
D
E
 
E
K
 
K
Q
 
V
S
 
S
I
 
K
S
 
N
L
 
L
M
 
A
Q
 
T
Q
 
Q
P
 
L
G
 
D
Q
 
S
A
 
A
Y
 
F
R
 
I
Q
 
R
A
 
K
E
 
E
P
 
P
L
 
F
G
 
G
V
 
L
V
 
V
L
 
L
I
 
I
I
 
I
G
 
V
P
 
P
W
 
W
N
 
N
Y
 
Y
P
 
P
F
 
I
Q
 
N
L
 
L
L
 
T
I
 
L
T
 
V
P
 
P
L
 
L
I
 
V
G
 
G
A
 
A
I
 
I
A
 
A
A
 
A
G
 
G
N
 
N
C
 
C
A
 
V
V
 
V
L
 
L
K
 
K
P
 
P
S
 
S
E
 
E
L
 
I
A
 
S
P
 
K
A
 
A
T
 
T
S
 
E
S
 
K
L
 
I
I
 
L
Q
 
A
R
 
E
L
 
V
I
 
L
S
 
P
D
 
R
R
 
Y
F
 
L
D
 
D
P
 
Q
D
 
S
Y
 
C
I
 
F
R
 
T
V
 
V
L
 
V
E
 
L
G
 
G
D
 
G
A
 
R
S
 
Q
V
 
E
S
 
T
Q
 
G
A
 
Q
L
 
L
I
 
L
T
 
E
Q
 
H
P
 
K
F
 
F
D
 
D
H
 
Y
I
 
I
F
 
F
F
 
F
T
 
T
G
 
G
G
 
N
T
 
A
A
 
Y
I
 
V
G
 
G
R
 
K
K
 
I
V
 
V
M
 
M
A
 
A
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
I
T
 
T
L
 
L
E
 
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
N
P
 
P
C
 
C
I
 
Y
V
 
V
D
 
D
T
 
D
D
 
N
I
 
C
D
 
D
L
 
P
D
 
Q
V
 
I
A
 
V
A
 
A
R
 
N
R
 
R
I
 
V
A
 
A
W
 
W
G
 
F
K
 
R
F
 
Y
F
 
F
N
 
N
A
 
A
G
 
G
Q
 
Q
T
 
T
C
 
C
I
 
V
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
I
L
 
L
V
 
C
Q
 
S
R
 
Q
T
 
E
V
 
M
A
 
Q
E
 
E
P
 
R
F
 
L
I
 
V
E
 
P
A
 
A
L
 
L
I
 
Q
D
 
N
N
 
A
I
 
I
Q
 
T
Q
 
R
F
 
F
Y
 
Y
G
 
G
E
 
D
D
 
N
P
 
P
Q
 
Q
Q
 
T
S
 
S
A
 
P
D
 
N
Y
 
L
A
 
G
R
 
R
I
 
I
V
 
I
S
 
N
D
 
Q
R
 
K
H
 
H
W
 
F
Q
 
K
R
 
R
L
 
L
N
 
Q
S
 
G
L
 
L
L
 
L
V
 
G
D
 
C
G
 
G
T
 
R
I
 
V
R
 
A
H
 
I
G
 
G
G
 
G
Q
 
Q
V
 
S
D
 
D
R
 
E
S
 
G
D
 
E
R
 
R
Y
 
Y
I
 
I
A
 
A
P
 
P
T
 
T
L
 
V
I
 
L
T
 
V
D
 
D
V
 
V
N
 
Q
W
 
E
R
 
T
D
 
E
P
 
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
 
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
I
L
 
L
P
 
P
I
 
L
L
 
V
I
 
T
Y
 
V
D
 
R
Q
 
S
L
 
L
D
 
D
E
 
E
A
 
A
I
 
I
A
 
E
Q
 
F
I
 
M
R
 
N
A
 
R
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
A
F
 
F
S
 
S
R
 
K
D
 
R
R
 
S
Q
 
Q
V
 
V
Q
 
I
E
 
K
R
 
Q
V
 
V
L
 
L
A
 
A
E
 
R
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
F
C
 
C
L
 
G
N
 
N
D
 
D
T
 
G
I
 
F
L
 
M
Q
 
H
V
 
M
G
 
T
V
 
L
P
 
S
D
 
S
A
 
L
A
 
P
F
 
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
T
S
 
S
G
 
G
M
 
M
G
 
G
G
 
R
Y
 
Y
H
 
H
G
 
G
K
 
K
A
 
F
S
 
S
F
 
F
E
 
D
T
 
T
F
 
F
S
 
S
H
 
N
Y
 
Q
K
 
R
L
 
A
V
 
C
L
 
L
K
 
L
R
 
R
P
 
S
F
 
P
W
 
G
L
 
M
D
 
E
L
 
K
A
 
I
-
 
N
-
 
D
L
 
L
R
 
R
Y
 
Y
P
 
P
P
 
P
Y
 
Y
G
 
S
D
 
S
K
 
R

Sites not aligning to the query:

P51648 Aldehyde dehydrogenase family 3 member A2; Aldehyde dehydrogenase 10; Fatty aldehyde dehydrogenase; Microsomal aldehyde dehydrogenase; EC 1.2.1.3; EC 1.2.1.94 from Homo sapiens (Human) (see 5 papers)
46% identity, 94% coverage: 16:448/459 of query aligns to 8:442/485 of P51648

query
sites
P51648
L
 
V
Q
 
R
A
 
Q
T
 
A
F
 
F
D
 
L
R
 
S
G
 
G
D
 
R
T
 
S
R
 
R
T
 
P
L
 
L
A
 
R
F
 
F
R
 
R
L
 
L
A
 
Q
R
 
Q
L
 
L
Q
 
E
D
 
A
L
 
L
A
 
R
K
 
R
L
 
M
V
 
V
A
 
Q
D
 
E
N
 
R
E
 
E
A
 
K
E
 
D
L
 
I
L
 
L
Q
 
T
A
 
A
L
x
I
A
 
A
S
 
A
D
 
D
L
 
L
R
 
C
K
 
K
P
 
S
A
 
E
L
 
F
E
 
N
A
 
V
Y
 
Y
A
 
S
S
 
Q
E
 
E
I
 
V
Y
 
I
F
 
T
V
|
V
R
 
L
D
 
G
Q
 
E
I
 
I
K
 
D
L
 
F
T
 
M
C
 
L
K
 
E
H
 
N
L
 
L
R
 
P
R
 
E
W
 
W
M
 
V
Q
 
T
P
 
A
E
 
K
K
 
P
Q
 
V
S
 
K
I
 
K
S
 
N
L
 
V
M
 
L
Q
 
T
Q
 
M
P
 
L
G
 
D
Q
 
E
A
 
A
Y
 
Y
R
 
I
Q
 
Q
A
 
P
E
 
Q
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
|
L
I
 
I
I
 
I
G
 
G
P
 
A
W
 
W
N
|
N
Y
 
Y
P
|
P
F
 
F
Q
 
V
L
 
L
L
 
T
I
 
I
T
 
Q
P
|
P
L
 
L
I
 
I
G
 
G
A
 
A
I
 
I
A
 
A
A
 
A
G
 
G
N
 
N
C
 
A
A
 
V
V
 
I
L
 
I
K
 
K
P
 
P
S
 
S
E
 
E
L
 
L
A
 
S
P
 
E
A
 
N
T
 
T
S
 
A
S
 
K
L
 
I
I
 
L
Q
 
A
R
 
K
L
 
L
I
 
L
S
 
P
D
 
Q
R
 
Y
F
 
L
D
 
D
P
 
Q
D
 
D
Y
 
L
I
 
Y
R
 
I
V
 
V
L
 
I
E
 
N
G
 
G
D
 
G
A
 
V
S
 
E
V
 
E
S
 
T
Q
 
T
A
 
E
L
 
L
I
 
L
T
 
K
Q
 
Q
P
 
R
F
 
F
D
 
D
H
 
H
I
 
I
F
 
F
F
 
Y
T
|
T
G
|
G
G
 
N
T
 
T
A
 
A
I
 
V
G
 
G
R
 
K
K
 
I
V
 
V
M
 
M
A
 
E
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
T
L
 
L
E
|
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
|
C
I
 
Y
V
 
I
D
 
D
T
 
K
D
 
D
I
 
C
D
 
D
L
 
L
D
 
D
V
 
I
A
 
V
A
 
C
R
 
R
R
|
R
I
 
I
A
 
T
W
 
W
G
 
G
K
 
K
F
 
Y
F
 
M
N
 
N
A
x
C
G
 
G
Q
 
Q
T
 
T
C
|
C
I
 
I
A
 
A
P
 
P
D
|
D
Y
 
Y
L
 
I
L
 
L
V
 
C
Q
 
E
R
 
A
T
 
S
V
 
L
A
 
Q
E
 
N
P
 
Q
F
 
I
I
 
V
E
 
W
A
 
K
L
 
I
I
 
K
D
 
E
N
 
T
I
 
V
Q
x
K
Q
 
E
F
 
F
Y
 
Y
G
 
G
E
 
E
D
 
N
P
 
I
Q
 
K
Q
 
E
S
 
S
A
 
P
D
 
D
Y
|
Y
A
 
E
R
 
R
I
 
I
V
 
I
S
 
N
D
 
L
R
 
R
H
 
H
W
 
F
Q
 
K
R
 
R
L
 
I
N
 
L
S
 
S
L
 
L
L
 
L
V
 
E
D
 
G
G
 
Q
T
 
K
I
 
I
R
 
A
H
 
F
G
 
G
G
 
G
Q
 
E
V
 
T
D
 
D
R
 
E
S
 
A
D
 
T
R
 
R
Y
 
Y
I
 
I
A
|
A
P
|
P
T
 
T
L
 
V
I
 
L
T
 
T
D
 
D
V
 
V
N
 
D
W
 
P
R
 
K
D
 
T
P
 
K
I
 
V
L
 
M
Q
 
Q
E
 
E
E
|
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
I
L
 
L
P
 
P
I
 
I
L
 
V
I
 
P
Y
 
V
D
 
K
Q
 
N
L
 
V
D
 
D
E
 
E
A
 
A
I
 
I
A
 
N
Q
 
F
I
 
I
R
 
N
A
 
E
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
V
F
 
F
S
|
S
R
 
H
D
 
N
R
 
H
Q
 
K
V
 
L
Q
 
I
E
 
K
R
 
R
V
 
M
L
 
I
A
 
D
E
 
E
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
V
C
 
T
L
 
G
N
 
N
D
 
D
T
 
V
I
 
I
L
 
M
Q
 
H
V
 
F
G
 
T
V
 
L
P
 
N
D
 
S
A
 
F
A
 
P
F
 
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
S
S
 
S
G
 
G
M
 
M
G
 
G
G
 
A
Y
|
Y
H
|
H
G
 
G
K
 
K
A
 
H
S
|
S
F
 
F
E
 
D
T
 
T
F
|
F
S
 
S
H
 
H
Y
 
Q
K
x
R
L
 
P
V
 
C
L
 
L
K
 
L
R
 
K
P
 
S
F
 
L
W
 
K
L
 
R
D
 
E
L
 
G
A
 
A
-
 
N
-
 
K
L
 
L
R
 
R
Y
 
Y
P
 
P
P
 
P

Sites not aligning to the query:

E9Q3E1 Aldehyde dehydrogenase family 3 member B2; Aldehyde dehydrogenase 8; EC 1.2.1.3 from Mus musculus (Mouse) (see paper)
46% identity, 96% coverage: 12:450/459 of query aligns to 20:460/479 of E9Q3E1

query
sites
E9Q3E1
T
 
T
L
 
L
A
 
H
A
 
S
L
 
L
Q
 
R
A
 
E
T
 
A
F
 
F
D
 
N
R
 
A
G
 
G
D
 
R
T
 
T
R
 
R
T
 
P
L
 
T
A
 
E
F
 
F
R
 
R
L
 
T
A
 
A
R
 
Q
L
 
L
Q
 
R
D
 
S
L
 
L
A
 
G
K
 
R
L
 
F
V
 
L
A
 
Q
D
 
E
N
 
N
E
 
K
A
 
E
E
 
L
L
 
L
L
 
Q
Q
 
D
A
 
A
L
 
L
A
 
A
S
 
K
D
 
D
L
 
V
R
 
G
K
 
K
P
 
S
A
 
G
L
 
F
E
 
E
A
 
S
Y
 
D
A
 
M
S
 
S
E
 
E
I
 
I
Y
 
I
F
 
L
V
 
C
R
 
E
D
 
N
Q
 
E
I
 
V
K
 
D
L
 
L
T
 
A
C
 
L
K
 
K
H
 
N
L
 
L
R
 
Q
R
 
T
W
 
W
M
 
M
Q
 
K
P
 
D
E
 
E
K
 
P
Q
 
V
S
 
S
I
 
T
S
 
N
L
 
L
M
 
L
Q
 
T
Q
 
K
P
 
L
G
 
S
Q
 
S
A
 
A
Y
 
F
R
 
I
Q
 
R
A
 
K
E
 
E
P
 
P
L
 
F
G
 
G
V
 
L
V
 
V
L
 
L
I
 
I
I
 
I
G
 
A
P
 
P
W
 
W
N
 
N
Y
 
Y
P
 
P
F
 
V
Q
 
N
L
 
L
L
 
M
I
 
I
T
 
I
P
 
P
L
 
L
I
 
V
G
 
G
A
 
A
I
 
I
A
 
A
A
 
A
G
 
G
N
 
N
C
 
C
A
 
V
V
 
V
L
 
L
K
 
K
P
 
P
S
 
S
E
 
E
L
 
I
A
 
S
P
 
K
A
 
N
T
 
T
S
 
E
S
 
K
L
 
V
I
 
L
Q
 
A
R
 
E
L
 
L
I
 
L
S
 
P
D
 
Q
R
 
Y
F
 
L
D
 
D
P
 
Q
D
 
S
Y
 
C
I
 
F
R
 
A
V
 
V
L
 
M
E
 
L
G
 
G
D
 
G
A
 
P
S
 
E
V
 
E
S
 
T
Q
 
R
A
 
Q
L
 
L
I
 
L
T
 
E
Q
 
H
P
 
K
F
 
F
D
 
D
H
 
Y
I
 
I
F
 
F
F
 
F
T
 
T
G
 
G
G
 
S
T
 
P
A
 
R
I
 
V
G
 
G
R
 
K
K
 
I
V
 
V
M
 
M
A
 
T
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
I
T
 
T
L
 
L
E
 
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
N
P
 
P
C
 
C
I
 
Y
V
 
V
D
 
D
T
 
D
D
 
N
I
 
C
D
 
D
L
 
P
D
 
Q
V
 
T
A
 
V
A
 
A
R
 
N
R
 
R
I
 
V
A
 
A
W
 
W
G
 
F
K
 
R
F
 
Y
F
 
F
N
 
N
A
 
A
G
 
G
Q
 
Q
T
 
T
C
 
C
I
 
V
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
I
L
 
L
V
 
C
Q
 
S
R
 
Q
T
 
E
V
 
M
A
 
Q
E
 
E
P
 
R
F
 
L
I
 
V
E
 
P
A
 
A
L
 
L
I
 
Q
D
 
N
N
 
S
I
 
I
Q
 
T
Q
 
R
F
 
F
Y
 
Y
G
 
G
E
 
D
D
 
N
P
 
P
Q
 
Q
Q
 
T
S
 
S
A
 
P
D
 
N
Y
 
L
A
 
G
R
 
R
I
 
I
V
 
I
S
 
N
D
 
Q
R
 
K
H
 
H
W
 
F
Q
 
K
R
 
R
L
 
L
N
 
Q
S
 
G
L
 
L
L
 
L
V
 
G
D
 
C
G
 
G
T
 
R
I
 
V
R
 
A
H
 
I
G
 
G
G
 
G
Q
 
Q
V
 
S
D
 
D
R
 
E
S
 
G
D
 
E
R
 
R
Y
 
Y
I
 
I
A
 
A
P
 
P
T
 
T
L
 
V
I
 
L
T
 
V
D
 
D
V
 
V
N
 
Q
W
 
E
R
 
T
D
 
E
P
 
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
 
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
I
L
 
L
P
 
P
I
 
L
L
 
V
I
 
T
Y
 
V
D
 
R
Q
 
S
L
 
L
D
 
D
E
 
E
A
 
A
I
 
I
A
 
E
Q
 
F
I
 
I
R
 
N
A
 
R
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
A
F
 
F
S
 
S
R
 
N
D
 
N
R
 
N
Q
 
Q
V
 
V
Q
 
V
E
 
N
R
 
Q
V
 
M
L
 
L
A
 
E
E
 
R
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
F
C
 
G
L
 
G
N
 
N
D
 
D
T
 
G
I
 
F
L
 
L
Q
 
Y
V
 
L
G
 
T
V
 
L
P
 
P
D
 
A
A
 
L
A
 
P
F
 
L
G
 
G
G
 
G
V
 
V
G
 
G
P
 
N
S
 
S
G
 
G
M
 
M
G
 
G
G
 
R
Y
 
Y
H
 
H
G
 
G
K
 
K
A
 
F
S
 
S
F
 
F
E
 
D
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
H
K
 
R
L
 
A
V
 
C
L
 
L
K
 
L
R
 
R
P
 
S
F
 
P
W
 
G
L
 
M
D
 
E
L
 
K
A
 
L
-
 
N
-
 
D
L
 
L
R
 
R
Y
 
Y
P
 
P
P
 
P
Y
 
Y
G
 
G

Sites not aligning to the query:

P43353 Aldehyde dehydrogenase family 3 member B1; Aldehyde dehydrogenase 7; EC 1.2.1.28; EC 1.2.1.5; EC 1.2.1.7 from Homo sapiens (Human) (see paper)
47% identity, 96% coverage: 10:448/459 of query aligns to 5:445/468 of P43353

query
sites
P43353
A
 
G
E
 
D
T
 
T
L
 
L
A
 
R
A
 
R
L
 
L
Q
 
R
A
 
E
T
 
A
F
 
F
D
 
H
R
 
A
G
 
G
D
 
R
T
 
T
R
 
R
T
 
P
L
 
A
A
 
E
F
 
F
R
 
R
L
 
A
A
 
A
R
 
Q
L
 
L
Q
 
Q
D
 
G
L
 
L
A
 
G
K
 
R
L
 
F
V
 
L
A
 
Q
D
 
E
N
 
N
E
 
K
A
 
Q
E
 
L
L
 
L
L
 
H
Q
 
D
A
 
A
L
 
L
A
 
A
S
 
Q
D
 
D
L
 
L
R
 
H
K
 
K
P
 
S
A
 
A
L
 
F
E
 
E
A
 
S
Y
 
E
A
 
V
S
 
S
E
 
E
I
 
V
Y
 
A
F
 
I
V
 
S
R
 
Q
D
 
G
Q
 
E
I
 
V
K
 
T
L
 
L
T
 
A
C
 
L
K
 
R
H
 
N
L
 
L
R
 
R
R
 
A
W
 
W
M
 
M
Q
 
K
P
 
D
E
 
E
K
 
R
Q
 
V
S
 
P
I
 
K
S
 
N
L
 
L
M
 
A
Q
 
T
Q
 
Q
P
 
L
G
 
D
Q
 
S
A
 
A
Y
 
F
R
 
I
Q
 
R
A
 
K
E
 
E
P
 
P
L
 
F
G
 
G
V
 
L
V
 
V
L
 
L
I
 
I
I
 
I
G
 
A
P
 
P
W
 
W
N
 
N
Y
 
Y
P
 
P
F
 
L
Q
 
N
L
 
L
L
 
T
I
 
L
T
 
V
P
 
P
L
 
L
I
 
V
G
 
G
A
 
A
I
 
L
A
 
A
A
 
A
G
 
G
N
 
N
C
 
C
A
 
V
V
 
V
L
 
L
K
 
K
P
 
P
S
 
S
E
 
E
L
 
I
A
 
S
P
 
K
A
 
N
T
 
V
S
 
E
S
 
K
L
 
I
I
 
L
Q
 
A
R
 
E
L
 
V
I
 
L
S
 
P
D
 
Q
R
 
Y
F
 
V
D
 
D
P
 
Q
D
 
S
Y
 
C
I
 
F
R
 
A
V
 
V
L
 
V
E
 
L
G
 
G
D
 
G
A
 
P
S
 
Q
V
 
E
S
 
T
Q
 
G
A
 
Q
L
 
L
I
 
L
T
 
E
Q
 
H
P
 
R
F
 
F
D
 
D
H
 
Y
I
 
I
F
 
F
F
 
F
T
 
T
G
 
G
G
 
S
T
 
P
A
 
R
I
 
V
G
 
G
R
 
K
K
 
I
V
 
V
M
 
M
A
 
T
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
T
L
 
L
E
 
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
N
P
 
P
C
 
C
I
 
Y
V
 
V
D
 
D
T
 
D
D
 
N
I
 
C
D
 
D
L
 
P
D
 
Q
V
 
T
A
 
V
A
 
A
R
 
N
R
 
R
I
 
V
A
 
A
W
 
W
G
 
F
K
 
R
F
 
Y
F
 
F
N
 
N
A
 
A
G
 
G
Q
 
Q
T
 
T
C
 
C
I
 
V
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
V
L
 
L
V
 
C
Q
 
S
R
 
P
T
 
E
V
 
M
A
 
Q
E
 
E
P
 
R
F
 
L
I
 
L
E
 
P
A
 
A
L
 
L
I
 
Q
D
 
S
N
 
T
I
 
I
Q
 
T
Q
 
R
F
 
F
Y
 
Y
G
 
G
E
 
D
D
 
D
P
 
P
Q
 
Q
Q
 
S
S
 
S
A
 
P
D
 
N
Y
 
L
A
 
G
R
 
R
I
 
I
V
 
I
S
 
N
D
 
Q
R
 
K
H
 
Q
W
 
F
Q
 
Q
R
 
R
L
 
L
N
 
R
S
 
A
L
 
L
L
 
L
V
 
G
D
 
C
G
 
G
T
 
R
I
 
V
R
 
A
H
 
I
G
 
G
G
 
G
Q
 
Q
V
 
S
D
 
D
R
 
E
S
 
S
D
 
D
R
 
R
Y
 
Y
I
 
I
A
 
A
P
 
P
T
 
T
L
 
V
I
 
L
T
 
V
D
 
D
V
 
V
N
 
Q
W
 
E
R
 
M
D
 
E
P
 
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
 
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
I
L
 
L
P
 
P
I
 
I
L
 
V
I
 
N
Y
 
V
D
 
Q
Q
 
S
L
 
L
D
 
D
E
 
E
A
 
A
I
 
I
A
 
E
Q
 
F
I
 
I
R
 
N
A
 
R
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
A
F
 
F
S
 
S
R
 
N
D
 
S
R
 
S
Q
 
Q
V
 
V
Q
 
V
E
 
K
R
 
R
V
 
V
L
 
L
A
 
T
E
 
Q
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
F
C
 
C
L
 
G
N
 
N
D
 
D
T
 
G
I
 
F
L
 
M
Q
 
H
V
 
M
G
 
T
V
 
L
P
 
A
D
 
S
A
 
L
A
 
P
F
 
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
A
S
 
S
G
 
G
M
 
M
G
 
G
G
 
R
Y
 
Y
H
 
H
G
 
G
K
 
K
A
 
F
S
 
S
F
 
F
E
 
D
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
H
K
 
R
L
 
A
V
 
C
L
 
L
K
 
L
R
 
R
P
 
S
F
 
P
W
 
G
L
 
M
D
 
E
L
 
K
-
 
L
-
 
N
A
 
A
L
 
L
R
 
R
Y
 
Y
P
 
P
P
 
P

Sites not aligning to the query:

J3QMK6 Aldehyde dehydrogenase family 3 member B3; EC 1.2.1.3 from Mus musculus (Mouse) (see paper)
46% identity, 96% coverage: 11:449/459 of query aligns to 19:459/479 of J3QMK6

query
sites
J3QMK6
E
 
E
T
 
K
L
 
L
A
 
Q
A
 
R
L
 
L
Q
 
K
A
 
E
T
 
A
F
 
F
D
 
N
R
 
T
G
 
G
D
 
K
T
 
T
R
 
K
T
 
T
L
 
A
A
 
K
F
 
F
R
 
R
L
 
A
A
 
E
R
 
Q
L
 
L
Q
 
Q
D
 
S
L
 
L
A
 
G
K
 
R
L
 
F
V
 
L
A
 
Q
D
 
D
N
 
N
E
 
S
A
 
K
E
 
Q
L
 
L
L
 
H
Q
 
D
A
 
A
L
 
L
A
 
D
S
 
G
D
 
D
L
 
L
R
 
G
K
 
K
P
 
S
A
 
G
L
 
F
E
 
E
A
 
S
Y
 
D
A
 
M
S
 
S
E
 
E
I
 
I
Y
 
I
F
 
L
V
 
C
R
 
E
D
 
N
Q
 
E
I
 
V
K
 
D
L
 
L
T
 
A
C
 
L
K
 
K
H
 
N
L
 
L
R
 
Q
R
 
T
W
 
W
M
 
M
Q
 
K
P
 
D
E
 
E
K
 
P
Q
 
V
S
 
S
I
 
T
S
 
N
L
 
L
M
 
L
Q
 
T
Q
 
K
P
 
L
G
 
S
Q
 
T
A
 
A
Y
 
F
R
 
I
Q
 
R
A
 
K
E
 
E
P
 
P
L
 
F
G
 
G
V
 
L
V
 
V
L
 
L
I
 
I
I
 
I
G
 
A
P
 
P
W
 
W
N
 
N
Y
 
Y
P
 
P
F
 
V
Q
 
N
L
 
L
L
 
M
I
 
I
T
 
I
P
 
P
L
 
L
I
 
V
G
 
G
A
 
A
I
 
I
A
 
A
A
 
A
G
 
G
N
 
N
C
 
C
A
 
V
V
 
V
L
 
L
K
 
K
P
 
P
S
 
S
E
 
E
L
 
I
A
 
S
P
 
K
A
 
N
T
 
T
S
 
E
S
 
K
L
 
V
I
 
L
Q
 
A
R
 
E
L
 
L
I
 
L
S
 
P
D
 
Q
R
 
Y
F
 
L
D
 
D
P
 
Q
D
 
S
Y
 
C
I
 
F
R
 
A
V
 
V
L
 
M
E
 
L
G
 
G
D
 
G
A
 
P
S
 
E
V
 
E
S
 
T
Q
 
G
A
 
Q
L
 
L
I
 
L
T
 
E
Q
 
H
P
 
K
F
 
F
D
 
D
H
 
Y
I
 
I
F
 
F
F
 
F
T
 
T
G
 
G
G
 
S
T
 
P
A
 
R
I
 
V
G
 
G
R
 
K
K
 
I
V
 
V
M
 
M
A
 
T
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
I
T
 
T
L
 
L
E
 
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
N
P
 
P
C
 
C
I
 
Y
V
 
V
D
 
D
T
 
D
D
 
N
I
 
C
D
 
D
L
 
P
D
 
Q
V
 
T
A
 
V
A
 
A
R
 
N
R
 
R
I
 
V
A
 
A
W
 
W
G
 
F
K
 
R
F
 
Y
F
 
F
N
 
N
A
 
A
G
 
G
Q
 
Q
T
 
T
C
 
C
I
 
V
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
I
L
 
L
V
 
C
Q
 
S
R
 
Q
T
 
E
V
 
M
A
 
Q
E
 
E
P
 
Q
F
 
L
I
 
V
E
 
P
A
 
A
L
 
L
I
 
Q
D
 
N
N
 
A
I
 
I
Q
 
T
Q
 
R
F
 
F
Y
 
Y
G
 
G
E
 
D
D
 
N
P
 
P
Q
 
Q
Q
 
T
S
 
S
A
 
P
D
 
N
Y
 
L
A
 
G
R
 
R
I
 
I
V
 
I
S
 
N
D
 
Q
R
 
K
H
 
H
W
 
F
Q
 
K
R
 
R
L
 
L
N
 
Q
S
 
G
L
 
L
L
 
L
V
 
G
D
 
C
G
 
G
T
 
R
I
 
V
R
 
A
H
 
I
G
 
G
G
 
G
Q
 
Q
V
 
S
D
 
D
R
 
E
S
 
G
D
 
E
R
 
R
Y
 
Y
I
 
I
A
 
A
P
 
P
T
 
T
L
 
V
I
 
L
T
 
V
D
 
D
V
 
V
N
 
Q
W
 
E
R
 
T
D
 
E
P
 
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
 
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
I
L
 
L
P
 
P
I
 
L
L
 
V
I
 
T
Y
 
V
D
 
R
Q
 
S
L
 
L
D
 
D
E
 
E
A
 
A
I
 
I
A
 
E
Q
 
F
I
 
M
R
 
N
A
 
Q
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
A
F
 
Y
S
 
S
R
 
N
D
 
N
R
 
A
Q
 
E
V
 
V
Q
 
I
E
 
K
R
 
Q
V
 
V
L
 
L
A
 
A
E
 
R
T
 
T
S
 
S
A
 
S
G
 
G
S
 
G
V
 
F
C
 
C
L
 
G
N
 
N
D
 
D
T
 
G
I
 
F
L
 
M
Q
 
Y
V
 
M
G
 
T
V
 
L
P
 
S
D
 
S
A
 
L
A
 
P
F
 
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
S
S
 
S
G
 
G
M
 
M
G
 
G
G
 
R
Y
 
Y
H
 
H
G
 
G
K
 
K
A
 
F
S
 
S
F
 
F
E
 
D
T
 
T
F
 
F
S
 
S
H
 
N
Y
 
Q
K
 
R
-
 
A
L
 
C
V
 
L
L
 
L
K
 
S
R
 
C
P
 
P
F
 
G
W
 
M
L
 
E
D
 
K
L
 
L
-
 
N
A
 
G
L
 
L
R
 
R
Y
 
Y
P
 
P
P
 
P
Y
 
Y

Sites not aligning to the query:

Q8W033 Aldehyde dehydrogenase family 3 member I1, chloroplastic; AtALDH3; Ath-ALDH3; EC 1.2.1.3 from Arabidopsis thaliana (Mouse-ear cress) (see paper)
46% identity, 98% coverage: 9:458/459 of query aligns to 75:529/550 of Q8W033

query
sites
Q8W033
A
 
A
A
 
A
E
 
L
T
 
L
L
 
V
A
 
D
A
 
E
L
 
L
Q
 
R
A
 
S
T
 
N
F
 
F
D
 
N
R
 
S
G
 
G
D
 
R
T
 
T
R
 
K
T
 
S
L
 
Y
A
 
E
F
 
W
R
 
R
L
 
I
A
 
S
R
 
Q
L
 
L
Q
 
Q
D
 
N
L
 
I
A
 
A
K
 
R
L
 
M
V
 
I
A
 
D
D
 
E
N
 
K
E
 
E
A
 
K
E
x
C
L
 
I
L
 
T
Q
 
E
A
 
A
L
 
L
A
 
Y
S
 
Q
D
 
D
L
 
L
R
 
S
K
 
K
P
 
P
A
 
E
L
 
L
E
 
E
A
 
A
Y
 
F
A
 
L
S
 
A
E
 
E
I
 
I
Y
 
S
F
 
N
V
 
T
R
 
K
D
 
S
Q
 
S
I
x
C
K
 
M
L
 
L
T
 
A
C
 
I
K
 
K
H
 
E
L
 
L
R
 
K
R
 
N
W
 
W
M
 
M
Q
 
A
P
 
P
E
 
E
K
 
T
Q
 
V
S
 
K
I
 
T
S
 
S
L
 
V
M
 
T
Q
 
T
Q
 
F
P
 
P
G
 
S
Q
 
S
A
 
A
Y
 
Q
R
 
I
Q
 
V
A
 
S
E
 
E
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
L
I
 
V
I
 
I
G
 
S
P
 
A
W
 
W
N
 
N
Y
 
F
P
 
P
F
 
F
Q
 
L
L
 
L
L
 
S
I
 
V
T
 
E
P
 
P
L
 
V
I
 
I
G
 
G
A
 
A
I
 
I
A
 
A
A
 
A
G
 
G
N
 
N
C
 
A
A
 
V
V
 
V
L
 
L
K
 
K
P
 
P
S
 
S
E
 
E
L
 
I
A
 
A
P
 
P
A
 
A
T
 
A
S
 
S
S
 
S
L
 
L
I
 
L
Q
 
A
R
 
K
L
 
L
I
 
F
S
 
S
D
 
E
R
 
Y
F
 
L
D
 
D
P
 
N
D
 
T
Y
 
T
I
 
I
R
 
R
V
 
V
L
 
I
E
 
E
G
 
G
D
 
G
A
 
V
S
 
P
V
 
E
S
 
T
Q
 
T
A
 
A
L
 
L
I
 
L
T
 
D
Q
 
Q
P
 
K
F
 
W
D
 
D
H
 
K
I
 
I
F
 
F
F
 
F
T
 
T
G
 
G
G
 
G
T
 
A
A
 
R
I
x
V
G
 
A
R
 
R
K
 
I
V
 
I
M
 
M
A
 
A
A
 
A
A
 
A
A
 
A
E
 
R
N
 
N
L
 
L
T
 
T
P
 
P
V
 
V
T
 
V
L
 
L
E
 
E
L
 
L
G
 
G
G
 
G
K
 
K
S
x
C
P
 
P
C
 
A
I
 
L
V
 
V
D
 
D
T
 
S
D
 
D
I
 
V
D
 
N
L
 
L
D
 
Q
V
 
V
A
 
A
A
 
A
R
 
R
R
 
R
I
 
I
A
 
I
W
 
A
G
 
G
K
 
K
F
 
W
-
 
A
F
x
C
N
 
N
A
 
S
G
 
G
Q
 
Q
T
 
A
C
|
C
I
 
I
A
 
G
P
 
V
D
 
D
Y
 
Y
L
 
V
L
 
I
V
 
T
Q
 
T
R
 
K
T
 
D
V
 
F
A
 
A
E
 
S
P
 
K
F
 
L
I
 
I
E
 
D
A
 
A
L
 
L
I
 
K
D
 
T
N
 
E
I
 
L
Q
 
E
Q
 
T
F
 
F
Y
 
F
G
 
G
E
 
Q
D
 
N
P
 
A
Q
 
L
Q
 
E
S
 
S
A
 
K
D
 
D
Y
 
L
A
 
S
R
 
R
I
 
I
V
 
V
S
 
N
D
 
S
R
 
F
H
 
H
W
 
F
Q
 
K
R
 
R
L
 
L
N
 
E
S
 
S
L
 
M
L
 
L
-
 
K
-
 
E
-
 
N
-
 
G
V
 
V
D
 
A
G
 
N
T
 
K
I
 
I
R
 
V
H
 
H
G
 
G
G
 
G
Q
 
R
V
 
I
D
 
T
R
 
E
S
 
D
D
 
K
R
 
L
Y
 
K
I
 
I
A
 
S
P
 
P
T
 
T
L
 
I
I
 
L
T
 
L
D
 
D
V
 
V
N
 
P
W
 
E
R
 
A
D
 
S
P
 
S
I
 
M
L
 
M
Q
 
Q
E
 
E
E
 
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
L
L
 
L
P
 
P
I
 
I
L
 
I
I
 
T
Y
 
V
D
 
Q
Q
 
K
L
 
I
D
 
E
E
 
D
A
 
G
I
 
F
A
 
Q
Q
 
V
I
 
I
R
 
R
A
 
S
Q
 
K
P
 
P
K
 
K
P
 
P
L
 
L
A
 
A
L
 
A
Y
 
Y
L
 
L
F
 
F
S
 
T
R
 
N
D
 
N
R
 
K
Q
 
E
V
 
L
Q
 
E
E
 
K
R
 
Q
V
 
F
L
 
V
A
 
Q
E
 
D
T
 
V
S
 
S
A
 
A
G
 
G
S
 
G
V
 
I
C
 
T
L
 
I
N
 
N
D
 
D
T
 
T
I
 
V
L
 
L
Q
 
H
V
 
V
G
 
T
V
 
V
P
 
K
D
 
D
A
 
L
A
 
P
F
 
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
E
S
 
S
G
 
G
M
 
I
G
 
G
G
 
A
Y
 
Y
H
 
H
G
 
G
K
 
K
A
 
F
S
 
S
F
 
Y
E
 
E
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
K
K
 
K
L
 
G
V
 
V
L
 
L
K
 
Y
R
 
R
P
 
S
F
 
F
W
 
S
L
 
G
D
 
D
L
 
A
A
 
D
L
 
L
R
 
R
Y
 
Y
P
 
P
P
 
P
Y
 
Y
G
 
T
D
 
P
K
 
K
I
 
K
N
 
K
L
 
M
F
 
V
R
 
L
K
 
K

5ucdA Benzaldehyde dehydrogenase, a class 3 aldehyde dehydrogenase, with bound NADP+ and benzoate adduct (see paper)
42% identity, 93% coverage: 7:433/459 of query aligns to 5:431/435 of 5ucdA

query
sites
5ucdA
P
 
P
A
 
A
A
 
K
A
 
I
E
 
D
T
 
S
L
 
L
-
 
F
A
 
S
A
 
A
L
 
Q
Q
 
K
A
 
A
T
 
Y
F
 
F
D
 
A
R
 
T
G
 
R
D
 
A
T
 
T
R
 
A
T
 
D
L
 
V
A
 
G
F
 
F
R
 
R
L
 
K
A
 
Q
R
 
S
L
 
L
Q
 
E
D
 
R
L
 
L
A
 
K
K
 
E
L
 
A
V
 
V
A
 
I
D
 
N
N
 
N
E
 
K
A
 
E
E
 
A
L
 
L
L
 
Y
Q
 
S
A
 
A
L
 
L
A
 
A
S
 
E
D
 
D
L
 
L
R
 
G
K
 
K
P
 
P
A
 
K
L
 
D
E
 
V
A
 
V
Y
 
D
A
 
L
S
 
A
E
 
E
I
 
I
Y
 
G
F
 
A
V
 
V
R
 
L
D
 
H
Q
 
E
I
 
I
K
 
D
L
 
F
T
 
A
C
 
L
K
 
A
H
 
H
L
 
L
R
 
D
R
 
E
W
 
W
M
 
V
Q
 
A
P
 
P
E
 
V
K
 
S
Q
 
V
S
 
P
I
 
S
S
 
P
L
 
D
M
 
I
Q
 
I
Q
 
A
P
 
P
G
 
S
Q
 
E
A
 
C
Y
 
Y
R
 
V
Q
 
V
A
 
Q
E
 
E
P
 
P
L
 
Y
G
 
G
V
 
V
V
 
T
L
 
Y
I
 
I
I
|
I
G
|
G
P
 
P
W
x
F
N
|
N
Y
 
Y
P
 
P
F
 
V
Q
 
N
L
 
L
L
 
T
I
 
L
T
 
T
P
 
P
L
 
L
I
 
I
G
 
G
A
 
A
I
 
I
A
 
I
A
 
G
G
 
G
N
 
N
C
 
T
A
 
C
V
 
I
L
 
I
K
|
K
P
 
P
S
|
S
E
|
E
L
 
T
A
 
T
P
 
P
A
 
E
T
 
T
S
 
S
S
 
A
L
 
V
I
 
I
Q
 
E
R
 
K
L
 
I
I
 
I
S
 
A
D
 
E
R
 
A
F
 
F
D
 
A
P
 
P
D
 
E
Y
 
Y
I
 
V
R
 
A
V
 
V
L
 
I
E
 
Q
G
 
G
D
 
G
A
x
R
S
 
D
V
 
E
S
 
N
Q
 
S
A
 
H
L
 
L
I
 
L
T
 
S
Q
 
L
P
 
P
F
 
F
D
 
D
H
 
F
I
 
I
F
 
F
F
|
F
T
|
T
G
|
G
G
x
S
T
 
P
A
 
N
I
x
V
G
 
G
R
 
K
K
 
V
V
 
V
M
 
M
A
 
Q
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
V
L
 
L
E
|
E
L
|
L
G
 
G
G
 
G
K
 
K
S
 
C
P
 
P
C
 
L
I
 
I
V
 
V
D
 
L
T
 
P
D
 
D
I
 
A
D
 
D
L
 
L
D
 
D
V
 
Q
A
 
T
A
 
V
R
 
N
R
 
Q
I
 
L
A
 
M
W
 
F
G
 
G
K
 
K
F
 
F
F
 
I
N
 
N
A
 
S
G
 
G
Q
 
Q
T
 
T
C
|
C
I
 
I
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
L
L
 
Y
V
 
V
Q
 
H
R
 
Y
T
 
S
V
 
V
A
 
K
E
 
D
P
 
A
F
 
L
I
 
L
E
 
E
A
 
R
L
 
L
I
 
V
D
 
E
N
 
R
I
 
V
Q
 
K
Q
 
T
F
 
-
Y
 
-
G
 
-
E
 
E
D
 
L
P
 
P
Q
 
E
Q
 
I
S
 
N
A
 
S
D
 
T
Y
 
-
A
 
G
R
 
K
I
 
L
V
 
V
S
 
T
D
 
E
R
 
R
H
 
Q
W
 
V
Q
 
Q
R
 
R
L
 
L
N
 
V
S
 
S
L
 
L
L
 
L
-
 
E
-
 
A
V
 
T
D
 
Q
G
 
G
T
 
Q
I
 
V
R
 
L
H
 
V
G
 
G
G
 
S
Q
 
Q
V
 
A
D
 
D
R
 
V
S
 
S
D
 
K
R
 
R
Y
 
A
I
 
L
A
 
S
P
 
A
T
 
T
L
 
V
I
 
V
T
 
D
D
 
G
V
 
V
N
 
E
W
 
W
R
 
N
D
 
D
P
 
P
I
 
L
L
 
M
Q
 
S
E
 
E
E
|
E
I
 
L
F
|
F
G
 
G
P
 
P
L
 
I
L
 
L
P
 
P
I
 
V
L
 
L
I
 
E
Y
 
F
D
 
D
Q
 
S
L
 
V
D
 
R
E
 
T
A
 
A
I
 
I
A
 
D
Q
 
Q
I
 
V
-
 
N
R
 
K
A
 
H
Q
 
H
P
 
P
K
 
K
P
 
P
L
 
L
A
 
A
L
 
V
Y
 
Y
L
 
V
F
 
F
S
 
G
R
 
K
D
 
D
R
 
M
Q
 
D
V
 
V
Q
 
A
E
 
K
R
 
G
V
 
I
L
 
I
A
 
N
E
 
Q
T
 
I
S
 
Q
A
 
S
G
 
G
S
 
D
V
 
A
C
 
Q
L
 
V
N
 
N
D
 
G
T
 
V
I
 
M
L
 
L
Q
 
H
V
 
A
G
 
F
V
 
S
P
 
P
D
 
Y
A
 
L
A
 
P
F
 
F
G
 
G
G
 
G
V
 
I
G
 
G
P
 
A
S
 
S
G
 
G
M
 
M
G
 
G
G
 
E
Y
|
Y
H
 
H
G
 
G
K
 
H
A
 
F
S
 
S
F
 
Y
E
 
L
T
 
T
F
 
F
S
 
T
H
 
H
Y
 
K
K
 
K
L
 
S
V
 
V

5nnoA Structure of tbaldh3 complexed with NAD and an3057 aldehyde (see paper)
40% identity, 95% coverage: 13:449/459 of query aligns to 16:472/484 of 5nnoA

query
sites
5nnoA
L
 
V
A
 
S
A
 
K
L
 
C
Q
 
R
A
 
E
T
 
A
F
 
F
D
 
N
R
 
D
G
 
D
D
 
A
T
 
N
R
 
R
T
 
D
L
 
L
A
 
K
F
 
K
R
 
R
L
 
K
A
 
Q
R
 
V
L
 
L
Q
 
R
D
 
S
L
 
L
A
 
L
K
 
N
L
 
L
V
 
V
A
 
E
D
 
E
N
 
N
E
 
T
A
 
D
E
 
E
L
 
F
L
 
C
Q
 
K
A
 
A
L
 
I
A
 
H
S
 
R
D
 
D
L
 
R
R
 
R
K
 
R
P
 
H
A
 
R
L
 
D
E
 
E
A
 
T
Y
 
V
A
 
V
S
 
M
E
 
E
I
 
I
Y
 
L
F
x
P
V
 
L
R
 
R
D
 
N
Q
 
E
I
 
V
K
 
W
L
 
H
T
 
L
C
 
I
K
 
E
H
 
H
L
 
M
R
 
D
R
 
E
W
 
Y
M
 
V
Q
 
K
P
 
P
E
 
V
K
 
K
Q
 
P
S
 
T
I
 
M
S
 
E
L
 
G
M
 
A
Q
 
A
Q
 
A
P
 
L
G
 
D
Q
 
D
A
 
C
Y
 
E
R
 
L
Q
 
Q
A
 
Y
E
 
E
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
L
I
 
V
I
|
I
G
|
G
P
 
T
W
|
W
N
|
N
Y
|
Y
P
 
P
F
 
L
Q
x
L
L
|
L
L
 
I
I
 
L
T
 
Q
P
 
P
L
 
L
I
 
L
G
 
G
A
 
A
I
 
L
A
 
A
A
 
A
G
 
G
N
 
N
C
 
T
A
 
A
V
 
V
L
 
I
K
|
K
P
 
P
S
 
S
E
|
E
L
 
L
A
 
A
P
 
P
A
 
A
T
 
T
S
 
A
S
 
E
L
 
L
I
 
L
Q
 
T
R
 
K
L
 
L
I
 
L
S
 
P
D
 
K
R
 
Y
F
 
V
D
 
S
P
 
S
D
 
D
Y
 
V
I
 
V
R
 
G
V
 
I
L
 
V
E
 
N
G
 
G
D
 
G
A
x
V
S
 
S
V
 
E
S
x
T
Q
 
T
A
 
A
L
 
V
I
 
L
T
 
K
Q
 
E
P
 
R
F
 
F
D
 
D
H
 
H
I
 
I
F
 
L
F
x
Y
T
|
T
G
|
G
G
x
S
T
 
A
A
 
R
I
x
V
G
 
A
R
 
E
K
 
I
V
 
V
M
 
M
A
 
A
A
 
A
A
 
A
A
 
A
E
 
K
N
 
H
L
 
L
T
 
T
P
 
P
V
 
V
T
 
T
L
 
L
E
|
E
L
|
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
V
I
 
V
V
 
V
D
 
D
T
 
D
D
 
T
I
 
C
-
 
A
-
 
D
D
 
N
L
 
M
D
 
K
V
 
V
A
 
V
A
 
A
R
 
E
R
 
R
I
 
I
A
 
M
W
 
W
G
 
G
K
 
K
F
 
I
F
 
I
N
 
N
A
 
A
G
 
G
Q
 
Q
T
|
T
C
x
S
I
 
I
A
 
A
P
 
P
D
 
D
Y
 
Y
L
 
V
L
 
V
V
 
V
Q
 
E
R
 
K
T
 
S
V
 
M
A
 
E
E
 
S
P
 
V
F
 
L
I
 
V
E
 
D
A
 
A
L
 
L
I
 
A
D
 
E
N
 
A
I
 
R
Q
 
K
Q
 
A
F
 
M
Y
 
L
G
 
G
E
 
D
D
 
K
-
 
F
-
 
L
-
 
K
-
 
V
-
 
L
-
 
K
-
 
G
-
 
E
-
 
L
-
 
L
-
 
V
-
 
K
-
 
Q
P
 
K
Q
 
Q
Q
 
Q
-
 
F
-
 
L
-
 
E
S
 
E
A
 
S
D
 
D
Y
 
Y
A
 
P
R
 
R
I
 
I
V
 
V
S
 
N
D
 
A
R
 
S
H
 
H
W
 
F
Q
 
Q
R
 
R
L
 
L
N
 
M
S
 
E
L
 
F
L
 
M
V
 
K
D
 
G
G
 
G
T
 
K
I
 
V
R
 
A
H
 
V
G
 
G
G
 
G
Q
 
E
V
 
A
D
 
D
R
 
E
S
 
A
D
 
T
R
 
L
Y
 
T
I
 
I
A
 
A
P
 
P
T
 
T
L
 
I
I
 
L
T
 
T
D
 
N
V
 
I
N
 
D
W
 
P
R
 
T
D
 
H
P
 
P
I
 
V
L
 
M
Q
 
Q
E
 
E
E
|
E
I
 
I
F
|
F
G
 
G
P
 
P
L
 
I
L
 
L
P
 
P
I
 
V
L
 
L
I
 
T
Y
 
Y
D
 
E
Q
 
N
L
 
E
D
 
K
E
 
D
A
 
I
I
 
L
A
 
K
Q
 
I
I
 
I
R
 
N
A
 
S
Q
 
R
P
 
E
K
 
K
P
 
P
L
 
L
A
 
A
L
 
L
Y
 
Y
L
 
V
F
 
F
S
 
S
R
 
N
D
 
N
R
 
K
Q
 
R
V
 
F
Q
 
I
E
 
R
R
 
G
V
 
V
L
 
E
A
 
S
E
 
R
T
 
T
S
 
S
A
 
S
G
 
G
S
 
A
V
 
V
C
 
V
L
 
V
N
 
N
D
 
D
T
 
V
I
 
V
L
 
V
Q
 
H
V
 
A
G
|
G
V
 
A
P
 
D
D
 
G
A
 
L
A
 
P
F
|
F
G
 
G
G
 
G
V
 
V
G
 
G
P
 
R
S
 
S
G
 
G
M
 
M
G
 
G
G
 
A
Y
|
Y
H
 
H
G
 
G
K
 
R
A
 
Y
S
 
S
F
 
F
E
 
E
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
R
K
 
R
L
 
P
V
 
V
L
 
M
K
 
R
R
 
R
P
 
G
F
 
F
W
 
L
L
 
F
D
 
S
L
 
S
-
 
I
-
 
D
A
 
T
L
 
V
R
 
R
Y
 
F
P
 
P
P
 
P
Y
 
Y

Q04458 Fatty aldehyde dehydrogenase HFD1; Hexadecenal dehydrogenase; EC 1.2.1.3; EC 1.2.1.64 from Saccharomyces cerevisiae (strain ATCC 204508 / S288c) (Baker's yeast) (see 2 papers)
34% identity, 92% coverage: 26:448/459 of query aligns to 44:481/532 of Q04458

query
sites
Q04458
R
 
K
T
 
D
L
 
L
A
 
E
F
 
F
R
 
R
L
 
Q
A
 
L
R
 
Q
L
 
L
Q
 
K
D
 
K
L
 
L
A
 
Y
K
 
Y
L
 
A
V
 
V
A
 
K
D
 
D
N
 
H
E
 
E
A
 
E
E
 
E
L
 
L
L
 
I
Q
 
D
A
 
A
L
 
M
A
 
Y
S
 
K
D
 
D
L
 
F
R
 
H
K
 
R
P
 
N
A
 
K
L
 
I
E
 
E
A
 
S
Y
 
V
A
 
L
S
 
N
E
 
E
I
 
T
Y
 
T
F
 
K
V
 
L
R
 
M
D
 
N
Q
 
D
I
 
I
K
 
L
L
 
H
T
 
L
C
 
I
K
 
E
H
 
I
L
 
L
R
 
P
R
 
K
W
 
L
M
 
I
Q
 
K
P
 
P
E
 
R
K
 
R
Q
 
V
S
 
S
I
 
D
S
 
S
L
 
-
M
 
-
Q
 
S
Q
 
P
P
 
P
-
 
F
-
 
M
-
 
F
G
 
G
Q
 
K
A
 
T
Y
 
I
R
 
V
Q
 
E
A
 
K
E
 
I
P
 
S
L
 
R
G
 
G
V
 
S
V
 
V
L
 
L
I
 
I
I
 
I
G
 
A
P
 
P
W
 
F
N
 
N
Y
 
F
P
 
P
F
 
L
Q
 
L
L
 
L
L
 
A
I
 
F
T
 
A
P
 
P
L
 
L
I
 
A
G
 
A
A
 
A
I
 
L
A
 
A
A
 
A
G
 
G
N
 
N
C
 
T
A
 
I
V
 
V
L
 
L
K
 
K
P
 
P
S
 
S
E
 
E
L
 
L
A
 
T
P
 
P
A
 
H
T
 
T
S
 
A
S
 
V
L
 
V
I
 
M
Q
 
E
R
 
N
L
 
L
I
 
L
S
 
T
D
 
T
R
 
A
F
 
G
D
 
F
P
 
P
D
 
D
-
 
G
Y
 
L
I
 
I
R
 
Q
V
 
V
L
 
V
E
 
Q
G
 
G
D
 
A
A
 
I
S
 
D
V
 
E
S
 
T
Q
 
T
A
 
R
L
 
L
I
 
L
-
 
D
T
 
C
Q
 
G
P
 
K
F
 
F
D
 
D
H
 
L
I
 
I
F
 
F
F
 
Y
T
 
T
G
 
G
G
 
S
T
 
P
A
 
R
I
 
V
G
 
G
R
 
S
K
 
I
V
 
V
M
 
A
A
 
E
A
 
K
A
 
A
A
 
A
E
 
K
N
 
S
L
 
L
T
 
T
P
 
P
V
 
C
T
 
V
L
 
L
E
 
E
L
 
L
G
 
G
G
 
G
K
 
K
S
|
S
P
 
P
C
 
T
I
 
F
V
 
I
D
 
T
T
 
E
D
 
N
I
 
F
-
 
K
-
 
A
-
 
S
D
 
N
L
 
I
D
 
K
V
 
I
A
 
A
A
 
L
R
 
K
R
 
R
I
 
I
A
 
F
W
 
F
G
 
G
K
 
A
F
 
F
F
 
G
N
 
N
A
 
S
G
 
G
Q
 
Q
T
 
I
C
|
C
I
 
V
A
 
S
P
 
P
D
 
D
Y
 
Y
L
 
L
L
 
L
V
 
V
Q
 
H
R
 
K
T
 
S
V
 
I
A
 
Y
E
 
P
P
 
K
F
 
V
I
 
I
E
 
K
A
 
E
L
 
C
I
 
E
D
 
S
N
 
V
I
 
L
Q
 
N
Q
 
E
F
 
F
Y
 
Y
G
 
P
E
 
S
D
 
F
P
 
D
Q
 
E
Q
 
Q
S
 
T
A
 
-
D
 
D
Y
 
F
A
 
T
R
 
R
I
 
M
V
 
I
S
 
H
D
 
E
R
 
P
H
 
A
W
 
Y
Q
 
K
R
 
K
-
 
A
-
 
V
-
 
A
-
 
S
L
 
I
N
 
N
S
 
S
L
 
T
L
 
N
V
 
G
D
 
S
G
 
K
T
 
I
I
 
V
R
 
P
H
 
S
G
 
K
G
 
I
Q
 
S
V
 
I
D
 
N
R
 
S
S
 
D
D
 
T
R
 
E
-
 
D
-
 
L
-
 
C
Y
 
L
I
 
V
A
 
P
P
 
P
T
 
T
L
 
I
I
 
V
T
 
Y
D
 
N
V
 
I
N
 
G
W
 
W
R
 
D
D
 
D
P
 
P
I
 
L
L
 
M
Q
 
K
E
 
Q
E
 
E
I
 
N
F
 
F
G
 
A
P
 
P
L
 
V
L
 
L
P
 
P
I
 
I
L
 
I
I
 
E
Y
 
Y
D
 
E
Q
 
D
L
 
L
D
 
D
E
 
E
A
 
T
I
 
I
A
 
N
Q
 
K
I
 
I
-
 
I
R
 
E
A
 
E
Q
 
H
P
 
D
K
 
T
P
 
P
L
 
L
A
 
V
L
 
Q
Y
 
Y
L
 
I
F
 
F
S
 
S
R
 
D
D
 
S
R
 
Q
Q
 
T
V
 
E
Q
 
I
E
 
N
R
 
R
V
 
I
L
 
L
A
 
T
E
 
R
T
 
L
S
 
R
A
 
S
G
 
G
S
 
D
V
 
C
C
 
V
L
 
V
N
 
G
D
 
D
T
 
T
I
 
V
L
 
I
Q
 
H
V
 
V
G
 
G
V
 
I
P
 
T
D
 
D
A
 
A
A
 
P
F
 
F
G
 
G
G
 
G
V
 
I
G
 
G
P
 
T
S
 
S
G
 
G
M
 
Y
G
 
G
G
 
N
Y
 
Y
H
 
G
G
 
G
K
 
Y
A
 
Y
S
 
G
F
 
F
E
 
N
T
 
T
F
 
F
S
 
S
H
 
H
Y
 
E
K
 
R
L
 
T
V
 
I
L
 
F
K
 
K
R
 
Q
P
 
P
F
 
Y
W
 
W
L
 
N
D
 
D
L
 
F
A
 
T
L
 
L
-
 
F
-
 
M
R
 
R
Y
 
Y
P
 
P
P
 
P

P17202 Aminoaldehyde dehydrogenase BADH; 4-trimethylammoniobutyraldehyde dehydrogenase BADH; Aminobutyraldehyde dehydrogenase BADH; Betaine aldehyde dehydrogenase; SoBADH; EC 1.2.1.-; EC 1.2.1.47; EC 1.2.1.19; EC 1.2.1.8 from Spinacia oleracea (Spinach) (see 3 papers)
33% identity, 75% coverage: 90:435/459 of query aligns to 129:484/497 of P17202

query
sites
P17202
E
 
Q
K
 
K
Q
 
A
S
 
P
I
 
V
S
 
T
L
 
L
M
 
P
Q
 
M
Q
 
E
P
 
R
G
 
F
Q
 
K
A
 
S
Y
 
H
R
 
V
Q
 
L
A
 
R
E
 
Q
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
G
I
 
L
I
 
I
G
x
S
P
|
P
W
|
W
N
 
N
Y
|
Y
P
 
P
F
 
L
Q
 
L
L
 
M
L
 
A
I
 
T
T
x
W
P
 
K
L
 
I
I
 
A
G
 
P
A
 
A
I
 
L
A
 
A
A
 
A
G
 
G
N
 
C
C
 
T
A
 
A
V
 
V
L
 
L
K
|
K
P
|
P
S
|
S
E
|
E
L
|
L
A
 
A
P
 
S
A
 
V
T
 
T
S
 
C
S
 
L
L
 
E
I
 
F
Q
 
G
R
 
E
L
 
V
I
 
C
S
 
N
D
 
E
-
 
V
R
 
G
F
 
L
D
 
P
P
 
P
D
 
G
Y
 
V
I
 
L
R
 
N
V
 
I
L
 
L
E
 
T
G
 
G
D
 
L
A
 
G
S
 
P
V
 
D
S
 
A
Q
 
G
A
 
A
-
 
P
L
 
L
I
 
V
T
 
S
Q
 
H
P
 
P
-
 
D
F
 
V
D
 
D
H
 
K
I
 
I
F
 
A
F
 
F
T
 
T
G
 
G
G
x
S
T
x
S
A
|
A
I
x
T
G
 
G
R
 
S
K
 
K
V
 
V
M
 
M
A
 
A
A
 
S
A
 
A
A
 
A
E
 
Q
N
 
L
L
x
V
T
 
K
P
 
P
V
 
V
T
 
T
L
 
L
E
 
E
L
|
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
I
I
 
V
V
 
V
D
 
F
T
 
E
D
 
D
I
 
V
D
 
D
L
 
I
D
 
D
V
 
K
A
 
V
A
 
V
R
 
E
R
 
W
I
 
T
A
 
I
W
 
F
G
 
G
K
 
C
F
 
F
F
x
W
N
 
T
A
 
N
G
 
G
Q
 
Q
T
 
I
C
 
C
I
 
S
A
 
A
P
 
T
D
 
S
Y
 
R
L
 
L
L
 
L
V
 
V
Q
 
H
R
 
E
T
 
S
V
 
I
A
 
A
E
 
A
P
 
E
F
 
F
I
 
V
E
 
D
A
 
K
L
 
L
I
 
V
D
 
K
N
 
W
I
 
T
Q
 
K
Q
 
N
F
 
I
Y
 
K
G
 
I
E
 
S
D
 
D
P
 
P
-
 
F
Q
 
E
Q
 
E
S
 
G
A
 
C
D
 
R
Y
 
L
A
 
G
R
 
P
I
 
V
V
 
I
S
 
S
D
 
K
R
 
G
H
 
Q
W
 
Y
Q
 
D
R
 
K
L
 
I
N
 
M
S
 
K
L
 
F
L
 
I
V
 
S
D
 
T
-
 
A
-
 
K
-
 
S
-
 
E
-
 
G
G
 
A
T
 
T
I
 
I
R
 
L
H
 
Y
G
 
G
G
 
G
Q
 
S
V
 
R
D
 
P
-
 
E
-
 
H
-
 
L
R
 
K
S
 
K
D
 
G
R
 
Y
Y
 
Y
I
 
I
A
 
E
P
 
P
T
 
T
L
 
I
I
 
V
T
 
T
D
 
D
V
 
I
N
 
S
W
 
T
R
 
S
D
 
M
P
 
Q
I
 
I
L
 
W
Q
 
K
E
 
E
E
|
E
I
 
V
F
 
F
G
 
G
P
 
P
L
 
V
L
 
L
P
 
C
I
 
V
L
 
K
I
 
T
Y
 
F
D
 
S
Q
 
S
L
 
E
D
 
D
E
 
E
A
 
A
I
 
I
A
 
A
Q
 
L
I
 
A
R
 
N
A
 
D
Q
 
T
P
 
E
K
 
Y
P
 
G
L
 
L
A
 
A
L
 
A
Y
 
A
L
 
V
F
 
F
S
 
S
R
 
N
D
 
D
R
 
L
Q
 
E
V
 
R
Q
 
C
E
 
E
R
 
R
V
 
I
L
 
T
A
 
K
E
 
A
T
 
L
S
 
E
A
 
V
G
 
G
S
x
A
V
 
V
C
 
W
L
 
V
N
 
N
D
 
C
T
 
S
I
 
-
L
 
-
Q
 
Q
V
 
P
G
x
C
V
 
F
P
 
V
D
 
Q
A
 
A
A
 
P
F
x
W
G
 
G
G
 
G
V
 
I
G
x
K
P
 
R
S
 
S
G
 
G
M
 
F
G
 
G
G
 
R
Y
 
E
H
 
L
G
 
G
K
 
E
A
 
W
S
 
G
F
 
I
E
 
Q
T
 
N
F
 
Y
S
 
L
H
 
N
Y
 
I
K
 
K
L
 
Q
V
 
V
L
 
T
K
 
Q

Sites not aligning to the query:

4v37A Crystal structure of betaine aldehyde dehydrogenase from spinach showing a thiohemiacetal with 3-aminopropionaldehyde
33% identity, 75% coverage: 90:435/459 of query aligns to 127:482/495 of 4v37A

query
sites
4v37A
E
 
Q
K
 
K
Q
 
A
S
 
P
I
 
V
S
 
T
L
 
L
M
 
P
Q
 
M
Q
 
E
P
 
R
G
 
F
Q
 
K
A
 
S
Y
 
H
R
 
V
Q
 
L
A
 
R
E
 
Q
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
G
I
 
L
I
|
I
G
x
S
P
|
P
W
|
W
N
|
N
Y
 
Y
P
 
P
F
 
L
Q
 
L
L
x
M
L
 
A
I
 
T
T
 
W
P
 
K
L
 
I
I
 
A
G
 
P
A
 
A
I
 
L
A
 
A
A
 
A
G
 
G
N
 
C
C
 
T
A
 
A
V
 
V
L
 
L
K
|
K
P
 
P
S
|
S
E
|
E
L
 
L
A
 
A
P
 
S
A
 
V
T
 
T
S
 
C
S
 
L
L
 
E
I
 
F
Q
 
G
R
 
E
L
 
V
I
 
C
S
 
N
D
 
E
-
 
V
R
 
G
F
 
L
D
 
P
P
 
P
D
 
G
Y
 
V
I
 
L
R
 
N
V
 
I
L
 
L
E
 
T
G
 
G
D
 
L
A
x
G
S
 
P
V
 
D
S
 
A
Q
x
G
A
|
A
-
 
P
L
 
L
I
 
V
T
 
S
Q
 
H
P
 
P
-
 
D
F
 
V
D
 
D
H
 
K
I
 
I
F
 
A
F
 
F
T
|
T
G
|
G
G
x
S
T
 
S
A
 
A
I
x
T
G
 
G
R
 
S
K
 
K
V
 
V
M
 
M
A
 
A
A
 
S
A
 
A
A
 
A
E
 
Q
N
 
L
L
 
V
T
 
K
P
 
P
V
 
V
T
 
T
L
 
L
E
|
E
L
|
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
I
I
 
V
V
 
V
D
 
F
T
 
E
D
 
D
I
 
V
D
 
D
L
 
I
D
 
D
V
 
K
A
 
V
A
 
V
R
 
E
R
 
W
I
 
T
A
 
I
W
 
F
G
 
G
K
 
C
F
 
F
F
 
W
N
 
T
A
 
N
G
 
G
Q
 
Q
T
 
I
C
x
A
I
 
S
A
 
A
P
 
T
D
 
S
Y
 
R
L
 
L
L
 
L
V
 
V
Q
 
H
R
 
E
T
 
S
V
 
I
A
 
A
E
 
A
P
 
E
F
 
F
I
 
V
E
 
D
A
 
K
L
 
L
I
 
V
D
 
K
N
 
W
I
 
T
Q
 
K
Q
 
N
F
 
I
Y
 
K
G
 
I
E
 
S
D
 
D
P
 
P
-
 
F
Q
 
E
Q
 
E
S
 
G
A
 
C
D
 
R
Y
 
L
A
 
G
R
 
P
I
 
V
V
 
I
S
 
S
D
 
K
R
 
G
H
 
Q
W
 
Y
Q
 
D
R
 
K
L
 
I
N
 
M
S
 
K
L
 
F
L
 
I
V
 
S
D
 
T
-
 
A
-
 
K
-
 
S
-
 
E
-
 
G
G
 
A
T
 
T
I
 
I
R
 
L
H
 
Y
G
 
G
G
 
G
Q
 
S
V
 
R
D
 
P
-
 
E
-
 
H
-
 
L
R
 
K
S
 
K
D
 
G
R
 
Y
Y
 
Y
I
 
I
A
 
E
P
 
P
T
 
T
L
 
I
I
 
V
T
 
T
D
 
D
V
 
I
N
 
S
W
 
T
R
 
S
D
 
M
P
 
Q
I
 
I
L
 
W
Q
 
K
E
 
E
E
|
E
I
 
V
F
|
F
G
 
G
P
 
P
L
 
V
L
 
L
P
 
C
I
 
V
L
 
K
I
 
T
Y
 
F
D
 
S
Q
 
S
L
 
E
D
 
D
E
 
E
A
 
A
I
 
I
A
 
A
Q
 
L
I
 
A
R
 
N
A
 
D
Q
 
T
P
 
E
K
 
Y
P
 
G
L
 
L
A
 
A
L
 
A
Y
 
A
L
 
V
F
 
F
S
 
S
R
 
N
D
 
D
R
 
L
Q
 
E
V
 
R
Q
 
C
E
 
E
R
 
R
V
 
I
L
 
T
A
 
K
E
 
A
T
 
L
S
 
E
A
 
V
G
 
G
S
 
A
V
 
V
C
 
W
L
 
V
N
 
N
D
 
C
T
 
S
I
 
-
L
 
-
Q
 
Q
V
 
P
G
x
C
V
 
F
P
 
V
D
 
Q
A
 
A
A
 
P
F
x
W
G
 
G
G
 
G
V
 
I
G
 
K
P
 
R
S
 
S
G
 
G
M
 
F
G
 
G
G
 
R
Y
x
E
H
 
L
G
 
G
K
 
E
A
 
W
S
 
G
F
 
I
E
 
Q
T
 
N
F
 
Y
S
 
L
H
 
N
Y
 
I
K
 
K
L
 
Q
V
 
V
L
 
T
K
 
Q

Q9HTJ1 NAD/NADP-dependent betaine aldehyde dehydrogenase; BADH; EC 1.2.1.8 from Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) (see 2 papers)
34% identity, 72% coverage: 104:433/459 of query aligns to 137:476/490 of Q9HTJ1

query
sites
Q9HTJ1
Y
 
Y
R
 
T
Q
 
R
A
 
R
E
 
E
P
 
P
L
 
L
G
 
G
V
 
V
V
 
V
L
 
A
I
 
G
I
 
I
G
|
G
P
x
A
W
|
W
N
|
N
Y
 
Y
P
 
P
F
 
V
Q
 
Q
L
 
I
L
 
A
I
 
L
T
 
W
P
x
K
L
 
S
I
 
A
G
 
P
A
 
A
I
 
L
A
 
A
A
 
A
G
 
G
N
 
N
C
 
A
A
 
M
V
 
I
L
 
F
K
|
K
P
|
P
S
|
S
E
|
E
L
 
V
A
 
T
P
 
P
A
 
L
T
 
T
S
 
A
S
 
L
L
 
K
I
 
L
Q
 
A
R
 
E
L
 
I
I
 
Y
S
 
T
D
 
E
R
 
A
F
 
G
D
 
V
P
 
P
D
 
D
Y
 
G
I
 
V
-
 
F
R
 
N
V
 
V
L
 
L
E
 
T
G
 
G
D
 
S
A
x
G
-
 
R
S
 
E
V
 
V
S
 
G
Q
 
Q
A
 
W
L
 
L
I
 
T
T
 
E
Q
 
H
P
 
P
F
 
L
-
 
I
D
 
E
H
 
K
I
 
I
F
 
S
F
 
F
T
 
T
G
 
G
G
|
G
T
|
T
A
x
S
I
x
T
G
 
G
R
 
K
K
 
K
V
 
V
M
 
M
A
 
A
-
 
S
A
 
A
A
 
S
A
 
S
E
 
S
N
 
S
L
 
L
T
 
K
P
 
E
V
 
V
T
 
T
L
 
M
E
|
E
L
 
L
G
 
G
G
 
G
K
 
K
S
 
S
P
 
P
C
 
L
I
 
I
V
 
I
D
 
F
T
 
P
D
 
D
I
 
A
D
 
D
L
 
L
D
 
D
V
 
R
A
 
A
A
 
A
R
 
D
R
 
I
I
 
A
A
 
V
W
 
M
G
 
A
K
 
N
F
 
F
F
 
F
N
 
S
A
 
S
G
 
G
Q
 
Q
T
 
V
C
|
C
I
 
T
A
 
N
P
 
G
D
 
T
Y
 
R
L
 
V
L
 
F
V
 
I
Q
 
H
R
 
R
T
 
S
V
 
Q
A
 
Q
E
 
A
P
 
R
F
 
F
I
 
E
E
 
A
A
 
K
L
 
V
I
 
L
D
 
E
N
 
R
I
 
V
Q
 
Q
Q
 
R
F
 
I
Y
 
R
G
 
L
E
 
G
D
 
D
P
 
P
Q
 
Q
-
 
D
Q
 
E
S
 
N
A
 
T
D
 
N
Y
 
F
A
 
G
R
 
P
I
 
L
V
 
V
S
 
S
D
 
F
R
 
P
H
 
H
W
 
M
Q
 
E
R
 
S
L
 
V
N
 
L
S
 
G
L
 
Y
L
 
I
V
 
E
D
 
S
G
 
G
T
 
K
I
 
A
R
 
Q
H
 
K
G
 
A
G
 
R
Q
 
L
V
 
L
D
 
C
R
 
G
S
 
G
D
 
E
R
 
R
-
 
V
-
 
T
-
 
D
-
 
G
-
 
A
-
 
F
-
 
G
-
 
K
-
 
G
-
 
A
Y
 
Y
I
 
V
A
 
A
P
 
P
T
 
T
L
 
V
I
 
F
T
 
T
D
 
D
V
 
C
N
 
R
W
 
D
R
 
D
D
 
M
P
 
T
I
 
I
L
 
V
Q
 
R
E
 
E
E
|
E
I
 
I
F
 
F
G
 
G
P
 
P
L
 
V
L
 
M
P
 
S
I
 
I
L
 
L
I
 
V
Y
 
Y
D
 
D
Q
 
D
L
 
E
D
 
D
E
 
E
A
 
A
I
 
I
A
 
R
Q
 
R
I
 
A
R
 
N
A
 
D
Q
 
T
P
 
E
K
 
Y
P
 
G
L
 
L
A
 
A
L
 
A
Y
 
G
L
 
V
F
 
V
S
 
T
R
 
Q
D
 
D
R
 
L
Q
 
A
V
 
R
Q
 
A
E
 
H
R
 
R
V
 
A
L
 
I
A
 
H
E
 
R
T
 
L
S
 
E
A
 
A
G
 
G
S
 
-
V
 
I
C
 
C
L
 
W
N
 
I
D
 
N
T
 
T
I
 
W
L
 
G
Q
 
E
V
 
-
G
 
S
V
 
P
P
 
A
D
 
E
A
 
M
A
 
P
F
 
V
G
 
G
G
 
G
V
 
Y
G
 
K
P
 
Q
S
 
S
G
 
G
M
 
V
G
 
G
G
 
R
Y
x
E
H
 
N
G
 
G
K
 
-
A
 
-
S
 
-
F
 
L
E
 
T
T
 
T
F
 
L
S
 
A
H
 
H
Y
 
Y
K
 
T
L
 
R
V
 
I

Query Sequence

>Synpcc7942_0489 Synpcc7942_0489 aldehyde dehydrogenase
MTAVVLPAAAETLAALQATFDRGDTRTLAFRLARLQDLAKLVADNEAELLQALASDLRKP
ALEAYASEIYFVRDQIKLTCKHLRRWMQPEKQSISLMQQPGQAYRQAEPLGVVLIIGPWN
YPFQLLITPLIGAIAAGNCAVLKPSELAPATSSLIQRLISDRFDPDYIRVLEGDASVSQA
LITQPFDHIFFTGGTAIGRKVMAAAAENLTPVTLELGGKSPCIVDTDIDLDVAARRIAWG
KFFNAGQTCIAPDYLLVQRTVAEPFIEALIDNIQQFYGEDPQQSADYARIVSDRHWQRLN
SLLVDGTIRHGGQVDRSDRYIAPTLITDVNWRDPILQEEIFGPLLPILIYDQLDEAIAQI
RAQPKPLALYLFSRDRQVQERVLAETSAGSVCLNDTILQVGVPDAAFGGVGPSGMGGYHG
KASFETFSHYKLVLKRPFWLDLALRYPPYGDKINLFRKL

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory