SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_007473537.1 NCBI__GCF_000170735.1:WP_007473537.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

P69451 Long-chain-fatty-acid--CoA ligase; Long-chain acyl-CoA synthetase; Acyl-CoA synthetase; EC 6.2.1.3 from Escherichia coli (strain K12) (see paper)
32% identity, 99% coverage: 4:518/519 of query aligns to 21:561/561 of P69451

query
sites
P69451
K
 
R
Y
 
Y
N
 
Q
N
 
S
F
 
L
Y
 
V
E
 
D
L
 
M
L
 
F
E
 
E
K
 
Q
N
 
S
A
 
V
K
 
A
E
 
R
I
 
Y
G
 
A
K
 
D
K
 
Q
T
 
P
A
 
A
Y
 
F
F
 
V
I
 
N
D
 
M
D
 
G
K
 
E
K
 
V
I
 
M
S
 
T
W
 
F
Q
 
R
D
 
K
V
 
L
K
 
E
K
 
E
K
 
R
V
 
S
D
 
R
T
 
A
F
 
F
A
 
A
R
 
A
T
 
Y
L
 
L
E
 
Q
L
 
Q
-
 
G
L
 
L
G
 
G
I
 
L
K
 
K
K
 
K
G
 
G
D
 
D
K
 
R
I
 
V
P
 
A
I
 
L
Y
 
M
V
 
M
N
 
P
N
 
N
S
 
L
L
 
L
E
 
Q
F
 
Y
V
 
P
I
 
V
A
 
A
L
 
L
F
 
F
G
 
G
I
 
I
Q
 
L
K
 
R
I
 
A
G
 
G
A
 
M
V
 
I
P
 
V
V
 
V
P
 
N
I
 
V
N
 
N
T
 
P
F
 
L
L
 
Y
K
 
T
E
 
P
D
 
R
E
 
E
I
 
L
S
 
E
F
 
H
I
 
Q
L
 
L
N
 
N
D
 
D
I
 
S
E
 
G
A
 
A
E
 
S
F
 
A
L
 
I
I
 
V
A
 
I
S
 
V
S
 
S
K
 
N
F
 
F
E
 
A
K
 
H
N
 
T
I
 
L
P
 
E
N
 
K
I
 
V
R
 
V
E
 
D
K
 
K
T
 
T
S
 
A
V
 
V
K
 
Q
K
 
H
I
 
V
I
 
I
W
 
L
E
 
T
-
 
R
-
 
M
-
 
G
-
 
D
-
 
Q
-
 
L
-
 
S
-
 
T
G
 
A
E
 
K
P
 
G
S
 
T
I
 
V
I
 
V
D
 
N
-
 
F
-
 
V
-
 
V
-
 
K
-
 
Y
-
 
I
-
 
K
-
 
R
-
 
L
-
 
V
-
 
P
-
 
K
-
 
Y
-
 
H
-
 
L
E
 
P
D
 
D
N
 
A
I
 
I
S
 
S
F
 
F
T
 
R
E
 
S
I
 
A
L
 
L
S
 
H
N
 
N
I
 
G
E
 
Y
P
 
R
H
 
M
E
 
Q
S
 
Y
I
 
V
E
 
K
Y
 
-
P
 
P
T
 
E
L
 
L
-
 
V
-
 
P
D
 
E
D
 
D
L
 
L
A
 
A
V
 
F
I
 
L
I
 
Q
Y
|
Y
T
|
T
S
 
G
G
|
G
T
|
T
T
 
T
G
|
G
K
 
V
P
 
A
K
|
K
G
 
G
A
 
A
M
 
M
L
 
L
T
 
T
Y
 
H
K
 
R
N
 
N
I
 
M
F
 
L
A
 
A
D
 
N
I
 
L
W
 
E
G
 
Q
I
 
V
N
 
N
E
 
A
I
 
T
V
 
Y
K
 
G
-
 
P
-
 
L
I
 
L
T
 
H
P
 
P
-
 
G
K
 
K
D
 
E
R
 
L
F
 
V
I
 
V
A
 
T
Y
 
A
L
 
L
P
 
P
M
 
L
F
 
Y
H
 
H
S
 
I
F
 
F
T
 
A
M
 
L
T
 
T
V
 
I
N
 
N
I
 
C
L
 
L
L
 
L
P
 
F
L
 
I
Y
 
E
T
 
L
G
 
G
S
 
G
A
 
Q
V
 
N
V
 
L
I
 
L
I
 
I
K
 
T
S
 
N
I
 
P
M
 
R
P
 
D
F
 
I
S
 
P
N
 
G
I
 
L
I
 
V
K
 
K
Q
 
E
T
 
L
L
 
A
L
 
K
K
 
Y
R
 
P
V
 
F
T
 
T
I
 
A
F
 
I
T
 
T
G
 
G
V
 
V
P
 
N
D
 
T
V
 
L
Y
 
F
S
 
N
A
 
A
L
 
L
S
 
L
R
 
N
A
 
N
K
 
K
L
 
-
P
 
-
F
 
-
Y
 
E
F
 
F
H
 
Q
W
 
Q
F
 
L
N
 
D
K
 
F
V
 
S
R
 
S
F
 
L
Y
 
H
V
 
L
S
 
S
G
 
A
A
 
G
A
 
G
A
 
G
L
 
M
P
 
P
G
 
V
E
 
Q
-
 
Q
-
 
V
V
 
V
L
 
A
E
 
E
R
 
R
F
 
W
S
 
V
K
 
K
K
 
-
F
 
L
K
 
T
K
 
G
A
 
Q
K
 
Y
L
 
L
L
 
L
E
 
E
G
 
G
Y
 
Y
G
 
G
L
 
L
S
 
T
E
|
E
T
 
C
S
 
A
P
 
P
V
 
L
V
 
V
A
 
S
V
 
V
N
 
N
R
 
-
P
 
P
Y
 
Y
L
 
D
-
 
I
-
 
D
Q
 
Y
K
 
H
P
 
S
G
 
G
S
 
S
V
 
I
G
 
G
P
 
L
A
 
P
I
 
V
P
 
P
G
 
S
V
 
T
E
 
E
V
 
A
K
 
K
I
 
L
V
 
V
N
 
D
D
 
D
E
 
D
L
 
D
I
 
N
E
 
E
V
 
V
P
 
P
I
 
P
G
 
G
E
 
Q
A
 
P
G
 
G
E
 
E
I
 
L
I
 
C
V
 
V
K
 
K
G
 
G
D
 
P
I
 
Q
V
 
V
M
 
M
K
 
L
G
 
G
Y
 
Y
Y
 
W
N
 
Q
R
 
R
D
 
P
E
 
D
A
 
A
N
 
T
E
 
D
E
 
E
C
 
I
L
 
I
I
 
K
N
 
N
G
 
G
W
 
W
F
 
L
L
 
H
T
 
T
G
 
G
D
 
D
I
 
I
G
 
A
K
 
V
V
 
M
D
 
D
E
 
E
D
 
E
G
 
G
F
 
F
I
 
L
Y
 
R
I
 
I
L
 
V
D
 
D
R
 
R
K
 
K
K
 
K
D
 
D
L
 
M
I
 
I
I
 
L
S
 
V
K
 
S
G
 
G
V
 
F
N
 
N
I
 
V
Y
 
Y
P
 
P
R
 
N
E
 
E
I
 
I
E
 
E
E
 
D
I
 
V
I
 
V
L
 
M
K
 
Q
F
 
H
P
 
P
G
 
G
I
 
V
K
 
Q
D
 
E
C
 
V
A
 
A
V
 
A
V
 
V
G
 
G
L
 
V
K
 
P
D
 
S
E
 
G
N
 
S
H
 
S
G
 
G
E
 
E
I
 
A
P
 
V
V
 
K
A
 
I
F
 
F
I
 
V
E
 
-
V
 
V
E
 
K
E
 
K
D
 
D
M
 
P
E
 
S
V
 
L
N
 
T
E
 
E
K
 
E
D
 
S
L
 
L
R
 
V
K
 
T
Y
 
F
L
 
C
K
 
R
S
 
R
K
 
Q
L
 
L
A
 
T
N
 
G
Y
 
Y
K
 
K
L
 
V
P
 
P
K
 
K
Y
 
L
I
 
V
Y
 
E
F
 
F
V
 
R
E
 
D
N
 
E
L
 
L
P
 
P
K
 
K
N
 
S
A
 
N
T
 
V
G
 
G
K
 
K
V
 
I
L
 
L
K
 
R
R
 
R
I
 
E
L
 
L
R
 
R
E
 
D
N
 
E
I
 
A
D
 
R
K
 
G
Y
 
K
I
 
V
S
 
D
N
 
N
K
 
K
G
 
A

P9WQ37 Long-chain-fatty-acid--CoA ligase FadD13; Fatty acyl-CoA ligase; FACL; FACL13; Fatty acyl-CoA synthetase; ACS; FACS; Very-long-chain fatty-acyl-CoA synthetase; ACSVL; EC 6.2.1.3 from Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) (see 4 papers)
34% identity, 93% coverage: 29:509/519 of query aligns to 27:496/503 of P9WQ37

query
sites
P9WQ37
D
 
D
K
 
V
K
 
R
I
 
M
S
 
T
W
 
Y
Q
 
A
D
 
Q
V
 
M
K
 
N
K
 
A
K
 
L
V
 
A
D
 
N
T
 
R
F
 
C
A
 
A
R
 
D
T
 
V
L
 
L
E
 
T
L
 
A
L
 
L
G
 
G
I
 
I
K
 
A
K
 
K
G
 
G
D
 
D
K
 
R
I
 
V
P
 
A
I
 
L
Y
 
L
V
 
M
N
 
P
N
 
N
S
 
S
L
 
V
E
 
E
F
 
F
V
 
C
I
 
C
A
 
L
L
 
F
F
 
Y
G
 
G
I
 
A
Q
 
A
K
 
K
I
 
L
G
 
G
A
 
A
V
 
V
P
 
A
V
 
V
P
 
P
I
 
I
N
 
N
T
 
T
F
 
R
L
 
L
K
 
A
E
 
A
D
 
P
E
 
E
I
 
V
S
 
S
F
 
F
I
 
I
L
 
L
N
 
S
D
 
D
I
 
S
E
 
G
A
 
S
E
 
K
F
 
V
L
 
V
I
 
I
A
 
Y
S
 
G
S
 
A
K
 
P
F
 
S
E
 
A
K
 
P
N
 
V
I
 
I
P
 
D
N
 
A
I
 
I
R
 
R
E
 
A
K
 
Q
T
 
A
S
 
D
V
 
P
K
 
P
K
 
G
I
 
T
I
 
V
-
 
T
-
 
D
W
 
W
E
 
I
G
 
G
E
 
A
P
 
D
S
 
S
I
 
L
I
 
-
D
 
-
E
 
-
D
 
-
N
 
-
I
 
-
S
 
-
F
 
-
T
 
A
E
 
E
I
 
R
L
 
L
S
 
R
N
 
S
I
 
A
E
 
A
P
 
A
H
 
D
E
 
E
S
 
P
I
 
A
E
 
V
Y
 
E
P
 
C
T
 
G
L
 
G
D
 
D
D
 
D
L
 
N
A
 
L
V
 
F
I
 
I
I
 
M
Y
 
Y
T
 
T
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
H
P
 
P
K
|
K
G
 
G
A
 
V
M
 
V
L
 
H
T
 
T
Y
 
H
K
 
E
N
 
S
I
 
V
F
 
H
A
 
S
D
 
A
I
 
A
W
 
S
G
 
S
I
 
W
N
 
A
E
 
S
I
 
T
V
 
I
K
 
D
I
 
V
T
x
R
P
 
Y
K
x
R
D
 
D
R
 
R
F
 
L
I
 
L
A
 
L
Y
 
P
L
 
L
P
 
P
M
 
M
F
 
F
H
 
H
S
x
V
F
 
A
T
x
A
M
 
L
T
 
T
V
x
T
N
 
V
I
 
I
L
 
-
L
 
-
P
 
-
L
 
-
Y
 
F
T
 
S
G
 
A
S
 
M
A
 
R
V
 
G
V
 
V
I
 
T
I
 
L
K
 
I
S
 
S
I
 
M
M
 
P
P
 
Q
F
 
F
S
 
D
N
 
A
I
 
T
I
 
K
K
 
V
Q
 
W
T
 
S
L
 
L
L
 
I
-
 
V
-
 
E
K
 
E
R
|
R
V
 
V
T
 
C
I
 
I
F
 
G
T
 
G
G
 
A
V
 
V
P
 
P
D
 
A
V
 
I
Y
 
L
S
 
N
A
 
F
L
 
M
S
 
R
R
 
-
A
 
-
K
 
Q
L
 
V
P
 
P
F
 
E
Y
 
F
F
 
A
H
 
E
W
 
L
-
 
D
F
 
A
N
 
P
K
 
D
V
 
F
R
 
R
F
 
Y
Y
 
F
V
 
I
S
 
T
G
 
G
A
 
G
A
 
A
A
 
P
L
 
M
P
 
P
G
 
E
E
 
A
V
 
L
L
 
I
E
 
K
R
 
I
F
 
Y
S
 
A
K
 
A
K
 
K
F
 
-
K
 
-
K
 
N
A
 
I
K
 
E
L
 
V
L
 
V
E
 
Q
G
 
G
Y
 
Y
G
x
A
L
 
L
S
 
T
E
 
E
T
 
S
S
 
C
P
 
G
-
 
G
-
 
G
V
 
T
V
 
L
A
 
L
V
 
L
N
 
S
R
 
E
P
 
D
Y
 
A
L
 
L
Q
 
R
K
 
K
P
 
A
G
 
G
S
 
S
V
 
A
G
 
G
P
 
R
A
 
A
I
 
T
P
 
M
G
 
F
V
 
T
E
 
D
V
 
V
K
 
A
I
 
V
V
 
R
N
 
G
D
 
D
E
 
D
L
 
G
I
 
V
E
 
I
V
 
R
P
 
E
I
 
H
G
 
G
E
 
E
A
 
-
G
 
G
E
 
E
I
 
V
I
 
V
V
 
I
K
 
K
G
 
S
D
 
D
I
 
I
V
 
L
M
 
L
K
 
K
G
 
E
Y
 
Y
Y
 
W
N
 
N
R
 
R
D
 
P
E
 
E
A
 
A
N
 
T
E
 
R
E
 
D
C
 
A
L
 
F
I
 
D
N
 
N
G
 
G
W
|
W
F
 
F
L
 
R
T
 
T
G
 
G
D
|
D
I
 
I
G
 
G
K
 
E
V
 
I
D
 
D
E
 
D
D
 
E
G
 
G
F
 
Y
I
 
L
Y
 
Y
I
 
I
L
 
K
D
 
D
R
|
R
K
 
L
K
 
K
D
 
D
L
 
M
I
 
I
I
 
I
S
|
S
K
 
G
G
|
G
V
 
E
N
 
N
I
 
V
Y
 
Y
P
 
P
R
 
A
E
 
E
I
 
I
E
 
E
E
 
S
I
 
V
I
 
I
L
 
I
K
 
G
F
 
V
P
 
P
G
 
G
I
 
V
K
 
S
D
 
E
C
 
V
A
 
A
V
 
V
V
 
I
G
 
G
L
 
L
K
 
P
D
 
D
E
 
E
N
 
K
H
 
W
G
 
G
E
 
E
I
 
I
P
 
A
V
 
A
A
 
A
F
 
I
I
 
V
E
 
-
V
 
V
E
 
A
E
 
D
D
 
Q
M
 
N
E
 
E
V
 
V
N
 
S
E
 
E
K
 
Q
D
 
Q
L
 
I
R
 
V
K
 
E
Y
 
Y
L
 
C
K
 
G
S
 
T
K
 
R
L
 
L
A
 
A
N
 
R
Y
 
Y
K
 
K
L
 
L
P
 
P
K
 
K
Y
 
K
I
 
V
Y
 
I
F
 
F
V
 
A
E
 
E
N
 
A
L
 
I
P
 
P
K
 
R
N
 
N
A
 
P
T
 
T
G
 
G
K
|
K
V
 
I
L
 
L
K
 
K
R
 
T
I
 
V
L
 
L
R
 
R
E
 
E
N
 
Q

Sites not aligning to the query:

3r44A Mycobacterium tuberculosis fatty acyl coa synthetase (see paper)
33% identity, 97% coverage: 4:509/519 of query aligns to 3:496/502 of 3r44A

query
sites
3r44A
K
 
K
Y
 
M
N
x
K
N
 
N
F
 
I
Y
 
G
E
 
W
L
 
M
L
 
L
E
 
R
K
 
Q
N
 
R
A
 
A
K
 
T
E
 
V
I
 
S
G
 
P
K
 
R
K
 
L
T
 
Q
A
 
A
Y
 
Y
F
 
V
-
 
E
-
 
P
I
 
S
D
 
T
D
 
D
K
 
V
K
 
R
I
 
M
S
 
T
W
 
Y
Q
 
A
D
 
Q
V
 
M
K
 
N
K
 
A
K
 
L
V
 
A
D
 
N
T
 
R
F
 
C
A
 
A
R
 
D
T
 
V
L
 
L
E
 
T
L
 
A
L
 
L
G
 
G
I
 
I
K
 
A
K
 
K
G
 
G
D
 
D
K
 
R
I
 
V
P
 
A
I
 
L
Y
 
L
V
 
M
N
 
P
N
 
N
S
 
S
L
 
V
E
 
E
F
 
F
V
 
C
I
 
C
A
 
L
L
 
F
F
 
Y
G
 
G
I
 
A
Q
 
A
K
 
K
I
 
L
G
 
G
A
 
A
V
 
V
P
 
A
V
 
V
P
 
P
I
 
I
N
 
N
T
 
T
F
 
R
L
 
L
K
 
A
E
 
A
D
 
P
E
 
E
I
 
V
S
 
S
F
 
F
I
 
I
L
 
L
N
 
S
D
 
D
I
 
S
E
 
G
A
 
S
E
 
K
F
 
V
L
 
V
I
 
I
A
 
Y
S
 
G
S
 
A
K
 
P
F
 
S
E
 
A
K
 
P
N
 
V
I
 
I
P
 
D
N
 
A
I
 
I
R
 
R
E
 
A
K
 
Q
T
 
A
S
 
D
V
 
P
K
 
P
K
 
G
I
 
T
I
 
V
-
 
T
-
 
D
W
 
W
E
 
I
G
 
G
E
 
A
P
 
D
S
 
S
I
 
L
I
 
-
D
 
-
E
 
-
D
 
-
N
 
-
I
 
-
S
 
-
F
 
-
T
 
A
E
 
E
I
 
R
L
 
L
S
 
R
N
 
S
I
 
A
E
 
A
P
 
A
H
 
D
E
 
E
S
 
P
I
 
A
E
 
V
Y
 
E
P
 
C
T
 
G
L
 
G
D
 
D
D
 
D
L
 
N
A
 
L
V
 
F
I
 
I
I
 
M
Y
 
Y
T
|
T
S
 
S
G
 
G
T
 
-
T
 
-
G
 
-
K
 
H
P
 
P
K
 
K
G
 
G
A
 
V
M
 
V
L
 
H
T
 
T
Y
 
H
K
x
E
N
 
S
I
 
V
F
x
H
A
 
S
D
x
A
I
 
A
W
 
S
G
 
S
I
 
W
N
 
A
E
 
S
I
 
T
V
 
I
K
 
D
I
 
V
T
 
R
P
 
Y
K
 
R
D
 
D
R
 
R
F
 
L
I
 
L
A
 
L
Y
 
P
L
 
L
P
 
P
M
 
M
F
 
F
H
|
H
S
 
V
F
 
A
T
 
A
M
 
L
T
 
T
V
 
T
N
 
V
I
 
I
L
 
-
L
 
-
P
 
-
L
 
-
Y
 
F
T
 
S
G
 
A
S
 
M
A
 
R
V
 
G
V
 
V
I
 
T
I
 
L
K
 
I
S
 
S
I
 
M
M
 
P
P
 
Q
F
 
F
S
 
D
N
 
A
I
 
T
I
 
K
K
 
V
Q
 
W
T
 
S
L
 
L
L
 
I
-
 
V
-
 
E
K
 
E
R
 
R
V
 
V
T
 
C
I
 
I
F
 
G
T
 
G
G
 
A
V
 
V
P
 
P
D
 
A
V
 
I
Y
 
L
S
 
N
A
 
F
L
 
M
S
 
R
R
 
-
A
 
-
K
 
Q
L
 
V
P
 
P
F
 
E
Y
 
F
F
 
A
H
 
E
W
 
L
-
 
D
F
 
A
N
 
P
K
 
D
V
 
F
R
 
R
F
 
Y
Y
 
F
V
 
I
S
 
T
G
 
G
A
 
G
A
 
A
A
 
P
L
 
M
P
 
P
G
 
E
E
 
A
V
 
L
L
 
I
E
 
K
R
 
I
F
 
Y
S
 
A
K
 
A
K
 
K
F
 
-
K
 
-
K
 
N
A
 
I
K
 
E
L
 
V
L
 
V
E
 
Q
G
 
G
Y
 
Y
G
 
A
L
 
L
S
x
T
E
|
E
T
 
S
S
 
C
P
 
G
-
 
G
-
 
G
V
 
T
V
 
L
A
 
L
V
 
L
N
 
S
R
 
E
P
 
D
Y
 
A
L
 
L
Q
 
R
K
 
K
P
 
A
G
 
G
S
 
S
V
 
A
G
 
G
P
 
R
A
 
A
I
 
T
P
 
M
G
 
F
V
 
T
E
 
D
V
 
V
K
 
A
I
 
V
V
 
R
N
 
G
D
 
D
E
 
D
L
 
G
I
 
V
E
 
I
V
 
R
P
 
E
I
 
H
G
 
G
E
 
E
A
 
-
G
 
G
E
 
E
I
 
V
I
 
V
V
 
I
K
 
K
G
 
S
D
 
D
I
 
I
V
 
L
M
 
L
K
 
K
G
 
E
Y
 
Y
Y
 
W
N
 
N
R
 
R
D
 
P
E
 
E
A
 
A
N
 
T
E
 
R
E
 
D
C
 
A
L
 
F
I
 
D
N
 
N
G
 
G
W
 
W
F
 
F
L
 
R
T
 
T
G
 
G
D
 
D
I
 
I
G
 
G
K
 
E
V
 
I
D
 
D
E
 
D
D
 
E
G
 
G
F
 
Y
I
 
L
Y
 
Y
I
 
I
L
 
K
D
 
D
R
 
R
K
 
L
K
 
K
D
 
D
L
 
M
I
 
I
I
|
I
S
 
S
K
 
G
G
 
G
V
 
E
N
|
N
I
 
V
Y
 
Y
P
 
P
R
 
A
E
 
E
I
 
I
E
 
E
E
 
S
I
 
V
I
 
I
L
 
I
K
 
G
F
 
V
P
 
P
G
 
G
I
 
V
K
 
S
D
 
E
C
 
V
A
 
A
V
 
V
V
 
I
G
 
G
L
 
L
K
 
P
D
 
D
E
 
E
N
 
K
H
 
W
G
 
G
E
 
E
I
 
I
P
 
A
V
 
A
A
 
A
F
 
I
I
 
V
E
 
-
V
 
V
E
 
A
E
 
D
D
 
Q
M
 
N
E
 
E
V
 
V
N
 
S
E
 
E
K
 
Q
D
 
Q
L
 
I
R
 
V
K
 
E
Y
 
Y
L
 
C
K
 
G
S
 
T
K
 
R
L
 
L
A
 
A
N
 
R
Y
 
Y
K
 
K
L
 
L
P
 
P
K
 
K
Y
 
K
I
 
V
Y
 
I
F
 
F
V
 
A
E
 
E
N
 
A
L
 
I
P
 
P
K
 
R
N
 
N
A
 
P
T
 
T
G
 
G
K
|
K
V
 
I
L
 
L
K
 
K
R
 
T
I
 
V
L
 
L
R
 
R
E
 
E
N
 
Q

4gxqA Crystal structure of atp bound rpmatb-bxbclm chimera b1 (see paper)
32% identity, 92% coverage: 31:509/519 of query aligns to 28:500/506 of 4gxqA

query
sites
4gxqA
K
 
K
I
 
I
S
 
S
W
 
Y
Q
 
A
D
 
E
V
 
L
K
 
V
K
 
A
K
 
R
V
 
A
D
 
G
T
 
R
F
 
V
A
 
A
R
 
N
T
 
V
L
 
L
E
 
V
L
 
A
L
 
R
G
 
G
I
 
L
K
 
Q
K
 
V
G
 
G
D
 
D
K
 
R
I
 
V
P
 
A
I
 
A
Y
 
Q
V
 
T
N
 
E
N
 
K
S
 
S
L
 
V
E
 
E
F
 
A
V
 
L
I
 
V
A
 
L
L
 
Y
F
 
L
G
 
A
I
 
T
Q
 
V
K
 
R
I
 
A
G
 
G
A
 
G
V
 
V
P
 
Y
V
 
L
P
 
P
I
 
L
N
 
N
T
 
T
F
 
A
L
 
Y
K
 
T
E
 
L
D
 
H
E
 
E
I
 
L
S
 
D
F
 
Y
I
 
F
L
 
I
N
 
T
D
 
D
I
 
A
E
 
E
A
 
P
E
 
K
F
 
I
L
 
V
I
 
V
A
 
C
S
 
D
S
 
P
K
 
S
F
 
K
E
 
R
K
 
D
N
 
G
I
 
I
P
 
A
N
 
A
I
 
I
R
 
A
E
 
A
K
 
K
-
 
V
-
 
G
T
 
A
S
 
T
V
 
V
K
 
E
K
 
T
I
 
L
I
 
G
W
 
P
E
 
D
G
 
G
E
 
R
P
 
G
S
 
S
I
 
L
I
 
T
D
 
D
E
 
A
D
 
A
N
 
A
I
 
G
S
 
A
F
 
S
T
 
E
E
 
A
I
 
F
L
 
-
S
 
-
N
 
-
I
 
-
E
 
-
P
 
-
H
 
-
E
 
A
S
 
T
I
 
I
E
 
D
Y
 
R
P
 
G
T
 
A
L
 
-
D
 
D
D
 
D
L
 
L
A
 
A
V
 
A
I
 
I
I
 
L
Y
 
Y
T
|
T
S
|
S
G
|
G
T
|
T
T
|
T
G
 
G
K
 
R
P
 
S
K
 
K
G
 
G
A
 
A
M
 
M
L
 
L
T
 
S
Y
 
H
K
 
D
N
 
N
I
 
L
F
 
A
A
 
S
D
x
N
I
 
S
W
 
L
G
 
T
I
 
L
N
 
V
E
 
D
I
 
Y
V
 
W
K
 
R
I
 
F
T
 
T
P
 
P
K
 
D
D
 
D
R
 
V
F
 
L
I
 
I
A
 
H
Y
 
A
L
 
L
P
 
P
M
 
I
F
 
Y
H
|
H
S
 
T
F
 
H
T
 
G
M
 
L
T
 
F
V
 
V
N
 
A
I
 
S
L
 
N
L
 
V
P
 
T
L
 
L
Y
 
F
T
 
A
G
 
R
S
 
G
A
 
S
V
 
M
V
 
I
I
 
F
I
 
L
K
 
P
S
 
K
I
 
F
M
 
D
P
 
P
F
 
-
S
 
D
N
 
K
I
 
I
I
 
L
K
 
D
Q
 
-
T
 
-
L
 
L
L
 
M
K
 
A
R
 
R
V
 
A
T
 
T
I
 
V
F
 
L
T
 
M
G
 
G
V
 
V
P
 
P
D
 
T
V
 
F
Y
 
Y
S
 
T
A
 
R
L
 
L
S
 
L
R
 
Q
A
 
S
K
 
P
L
 
R
P
 
-
F
 
L
Y
 
T
F
 
K
H
 
E
W
 
T
F
 
T
N
 
G
K
 
H
V
 
M
R
 
R
F
 
L
Y
 
F
V
 
I
S
 
S
G
 
G
A
x
S
A
|
A
A
x
P
L
 
L
P
 
L
G
 
A
E
 
D
V
 
T
L
 
H
E
 
R
R
 
E
F
 
W
S
 
S
K
 
A
K
 
K
F
 
T
K
 
G
K
 
H
A
 
A
K
 
-
L
 
V
L
 
L
E
|
E
G
x
R
Y
 
Y
G
|
G
L
x
M
S
x
T
E
|
E
T
 
T
S
 
N
P
 
-
V
 
-
V
 
M
A
 
N
V
 
T
N
 
S
R
 
N
P
 
P
Y
 
Y
L
 
D
-
 
G
-
 
D
Q
 
R
K
 
V
P
 
P
G
 
G
S
 
A
V
 
V
G
 
G
P
 
P
A
 
A
I
 
L
P
 
P
G
 
G
V
 
V
E
 
S
V
 
A
K
 
R
I
 
V
V
 
T
N
 
D
D
 
P
E
 
E
L
 
T
-
 
G
I
 
K
E
 
E
V
 
L
P
 
P
I
 
R
G
 
G
E
 
D
A
 
I
G
 
G
E
 
M
I
 
I
I
 
E
V
 
V
K
 
K
G
 
G
D
 
P
I
 
N
V
 
V
M
 
F
K
 
K
G
 
G
Y
 
Y
Y
 
W
N
 
R
R
 
M
D
 
P
E
 
E
-
 
K
A
 
T
N
 
K
E
 
S
E
 
E
C
 
F
L
 
R
I
 
D
N
 
D
G
 
G
W
 
F
F
 
F
L
 
I
T
 
T
G
 
G
D
|
D
I
 
L
G
 
G
K
 
K
V
 
I
D
 
D
E
 
E
D
 
R
G
 
G
F
 
Y
I
 
V
Y
 
H
I
 
I
L
 
L
D
 
G
R
|
R
K
 
G
K
 
K
D
 
D
L
 
L
I
 
V
I
|
I
S
 
T
K
 
G
G
 
G
V
 
F
N
|
N
I
 
V
Y
 
Y
P
 
P
R
 
K
E
 
E
I
 
I
E
 
E
E
 
S
I
 
E
I
 
I
L
 
D
K
 
A
F
 
M
P
 
P
G
 
G
I
 
V
K
 
V
D
 
E
C
 
S
A
 
A
V
 
V
V
 
I
G
 
G
L
 
V
K
 
P
D
 
H
E
 
A
N
 
D
H
 
F
G
 
G
E
 
E
I
 
G
P
 
V
V
 
T
A
 
A
F
 
F
I
 
V
E
 
V
V
 
L
E
 
K
E
 
R
D
 
E
M
 
F
-
 
A
-
 
P
-
 
S
E
 
E
V
 
I
N
 
L
E
 
A
K
 
E
D
 
E
L
 
L
R
 
K
K
 
A
Y
 
F
L
 
V
K
 
K
S
 
D
K
 
R
L
 
L
A
 
A
N
 
K
Y
 
F
K
 
K
L
 
M
P
 
P
K
 
K
Y
 
K
I
 
V
Y
 
I
F
 
F
V
 
V
E
 
D
N
 
D
L
 
L
P
 
P
K
 
R
N
 
N
A
 
T
T
 
M
G
 
G
K
x
A
V
 
V
L
 
Q
K
 
K
R
 
N
I
 
V
L
 
L
R
 
R
E
 
E
N
 
T

Q9S725 4-coumarate--CoA ligase 2; 4CL 2; 4-coumarate--CoA ligase isoform 2; At4CL2; 4-coumaroyl-CoA synthase 2; Caffeate--CoA ligase; EC 6.2.1.12; EC 6.2.1.- from Arabidopsis thaliana (Mouse-ear cress) (see 3 papers)
31% identity, 93% coverage: 33:516/519 of query aligns to 65:556/556 of Q9S725

query
sites
Q9S725
S
 
T
W
 
Y
Q
 
A
D
 
D
V
 
V
K
 
H
K
 
V
K
 
T
V
 
S
D
 
R
T
 
K
F
 
L
A
 
A
R
 
A
T
 
G
L
 
L
E
 
H
L
 
N
L
 
L
G
 
G
I
 
V
K
 
K
K
 
Q
G
 
H
D
 
D
K
 
V
I
 
V
P
 
M
I
 
I
Y
 
L
V
 
L
N
 
P
N
 
N
S
 
S
L
 
P
E
 
E
F
 
V
V
 
V
I
 
L
A
 
T
L
 
F
F
 
L
G
 
A
I
 
A
Q
 
S
K
 
F
I
 
I
G
 
G
A
 
A
V
 
I
P
 
T
V
 
T
P
 
S
I
 
A
N
 
N
T
 
P
F
 
F
L
 
F
K
 
T
E
 
P
D
 
A
E
 
E
I
 
I
S
 
S
F
 
K
I
 
Q
L
 
A
N
 
K
D
 
A
I
 
S
E
 
A
A
 
A
E
 
K
F
 
L
L
 
I
I
 
V
A
 
T
S
 
Q
S
 
S
K
 
R
F
 
Y
E
 
V
K
 
D
N
 
K
I
 
I
P
 
K
N
 
N
I
 
L
R
 
Q
E
 
N
K
 
D
T
 
G
S
 
V
V
 
-
K
 
-
K
 
-
I
 
L
I
 
I
W
 
V
E
 
T
G
 
T
E
 
D
P
 
S
S
 
D
I
 
A
I
 
I
D
 
P
E
 
E
D
 
N
N
 
C
I
 
L
S
 
R
F
 
F
T
 
S
E
 
E
I
 
L
L
 
T
S
 
Q
N
 
S
I
 
E
E
 
E
P
 
P
H
 
R
-
 
V
E
 
D
S
 
S
I
 
I
-
 
P
E
 
E
Y
 
K
P
 
I
T
 
S
L
 
P
D
 
E
D
 
D
L
 
V
A
 
V
V
 
A
I
 
L
I
 
P
Y
 
F
T
 
S
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
L
P
 
P
K
|
K
G
 
G
A
 
V
M
 
M
L
 
L
T
 
T
Y
 
H
K
 
K
N
 
G
I
 
L
F
 
V
A
 
T
D
 
S
I
 
V
W
 
A
-
 
Q
-
 
Q
-
 
V
-
 
D
G
 
G
I
 
E
N
 
N
E
 
P
I
 
N
V
 
L
K
 
Y
I
 
F
T
 
N
P
 
R
K
 
D
D
 
D
R
 
V
F
 
I
I
 
L
A
 
C
Y
 
V
L
 
L
P
 
P
M
 
M
F
 
F
H
 
H
S
 
I
F
 
Y
T
 
A
M
 
L
T
 
N
V
 
S
N
 
I
I
 
M
L
 
L
L
 
C
P
 
S
L
 
L
Y
 
R
T
 
V
G
 
G
S
 
A
A
 
T
V
 
I
V
 
L
I
 
I
I
 
M
K
 
P
S
 
K
I
 
-
M
 
F
P
 
E
F
 
I
S
 
T
N
 
L
I
 
L
I
 
L
K
 
E
Q
 
Q
T
 
I
L
 
Q
L
 
R
K
 
C
R
 
K
V
 
V
T
 
T
I
 
V
F
 
A
T
x
M
G
 
V
V
 
V
P
 
P
D
 
P
V
 
I
Y
 
V
S
 
L
A
 
A
L
 
I
S
 
-
R
 
-
A
 
A
K
 
K
L
 
S
P
 
P
F
 
E
Y
 
T
F
 
E
H
 
K
W
 
Y
-
 
D
F
 
L
N
 
S
K
 
S
V
 
V
R
 
R
F
 
M
Y
 
V
V
x
K
S
 
S
G
 
G
A
 
A
A
 
A
A
 
P
L
 
L
P
 
G
G
 
K
E
 
E
V
 
L
L
 
E
E
 
D
R
 
A
F
 
I
S
 
S
K
 
A
K
 
K
F
 
F
K
 
P
K
 
N
A
 
A
K
 
K
L
 
L
L
 
G
E
 
Q
G
 
G
Y
 
Y
G
 
G
L
 
M
S
 
T
E
 
E
T
 
A
S
 
G
P
 
P
V
 
V
V
 
L
A
 
A
V
 
M
N
 
S
-
 
L
-
 
G
-
 
F
-
 
A
-
 
K
R
 
E
P
 
P
Y
 
F
L
 
P
Q
 
V
K
 
K
P
 
S
G
 
G
S
 
A
V
 
C
G
 
G
P
 
T
A
 
V
I
 
V
P
 
R
G
 
N
V
 
A
E
 
E
V
 
M
K
 
K
I
 
I
V
 
L
N
 
D
-
 
P
D
 
D
E
 
T
L
 
G
I
 
D
E
 
S
V
 
L
P
 
P
I
 
R
G
 
N
E
 
K
A
 
P
G
 
G
E
|
E
I
 
I
I
x
C
V
 
I
K
 
R
G
 
G
D
 
N
I
 
Q
V
 
I
M
 
M
K
 
K
G
 
G
Y
 
Y
Y
 
L
N
 
N
R
 
D
D
 
P
E
 
L
A
 
A
N
 
T
E
 
A
E
 
S
C
 
T
L
 
I
I
 
D
-
 
K
N
 
D
G
 
G
W
 
W
F
 
L
L
 
H
T
 
T
G
 
G
D
 
D
I
 
V
G
 
G
K
 
F
V
 
I
D
 
D
E
 
D
D
 
D
G
 
D
F
 
E
I
 
L
Y
 
F
I
 
I
L
 
V
D
 
D
R
|
R
K
 
L
K
 
K
D
 
E
L
 
L
I
 
I
I
 
K
S
 
Y
K
|
K
G
 
G
V
 
F
N
 
Q
I
 
V
Y
 
A
P
 
P
R
 
A
E
 
E
I
 
L
E
 
E
E
 
S
I
 
L
I
 
L
L
 
I
K
 
G
F
 
H
P
 
P
G
 
E
I
 
I
K
 
N
D
 
D
C
 
V
A
 
A
V
 
V
V
 
V
G
 
A
L
 
M
K
 
K
D
 
E
E
 
E
N
 
D
H
 
A
G
 
G
E
 
E
I
 
V
P
 
P
V
 
V
A
 
A
F
 
F
I
 
V
E
 
V
V
 
R
E
 
S
E
 
K
D
 
D
M
 
S
E
 
N
V
 
I
N
 
S
E
 
E
K
 
D
D
 
E
L
 
I
R
 
K
K
 
Q
Y
 
F
L
 
V
K
 
S
S
 
K
K
 
Q
L
 
V
A
 
V
N
 
F
Y
 
Y
K
 
K
L
 
R
P
 
I
K
 
N
Y
 
K
I
 
V
Y
 
F
F
 
F
V
 
T
E
 
D
N
 
S
L
 
I
P
 
P
K
 
K
N
 
A
A
 
P
T
 
S
G
 
G
K
|
K
V
 
I
L
 
L
K
 
R
R
 
K
I
 
D
L
 
L
R
 
R
E
 
A
N
 
R
I
 
L
D
 
A
K
 
N
Y
 
G
I
 
L
S
 
M
N
 
N

4wv3B Crystal structure of the anthranilate coa ligase auaeii in complex with anthranoyl-amp (see paper)
30% identity, 97% coverage: 5:508/519 of query aligns to 9:510/518 of 4wv3B

query
sites
4wv3B
Y
 
Y
N
 
Y
N
 
N
F
 
A
Y
 
V
E
 
D
L
 
I
L
 
L
E
 
E
K
 
R
N
 
N
A
 
L
K
 
P
E
 
V
I
 
R
G
 
A
K
 
N
K
 
K
T
 
T
A
 
A
Y
 
L
F
 
F
I
 
T
D
 
P
D
 
D
K
 
R
K
 
E
I
 
M
S
 
T
W
 
F
Q
 
R
D
 
Q
V
 
V
K
 
S
K
 
N
K
 
E
V
 
A
D
 
N
T
 
Q
F
 
V
A
 
G
R
 
N
T
 
A
L
 
L
E
 
K
L
 
G
L
 
L
G
 
G
I
 
V
K
 
R
K
 
F
G
 
G
D
 
E
K
 
C
I
 
V
P
 
G
I
 
L
Y
 
L
V
 
T
N
 
L
N
 
D
S
 
S
L
 
A
E
 
E
F
 
W
V
 
V
I
 
T
A
 
S
L
 
F
F
 
F
G
 
G
I
 
I
Q
 
V
K
 
K
I
 
L
G
 
G
A
 
A
V
 
I
P
 
A
V
 
V
P
 
G
I
 
I
N
 
N
T
 
T
F
 
L
L
 
L
K
 
K
E
 
P
D
 
P
E
 
E
I
 
Y
S
 
E
F
 
Y
I
 
I
L
 
L
N
 
R
D
 
D
I
 
C
E
 
R
A
 
A
E
 
R
F
 
V
L
 
L
I
 
I
A
 
V
S
 
H
S
 
Q
K
 
E
F
 
F
E
 
L
K
 
P
N
 
L
I
 
I
P
 
E
N
 
S
I
 
I
R
 
R
E
 
G
K
 
N
T
 
L
S
 
P
V
 
M
K
 
L
K
 
E
-
 
H
-
 
I
-
 
V
I
 
V
I
 
I
W
 
G
E
 
E
G
 
G
E
 
P
P
 
-
S
 
-
I
 
-
I
 
-
D
 
Q
E
 
E
D
 
G
N
 
Y
I
 
L
S
 
S
F
 
F
T
 
N
E
 
D
I
 
W
L
 
I
-
 
R
-
 
P
-
 
Q
-
 
P
S
 
T
N
 
T
I
 
L
E
 
E
P
 
A
H
 
A
E
 
Q
S
 
S
I
 
H
E
 
R
Y
 
-
P
 
-
T
 
-
L
 
-
D
 
E
D
 
D
L
 
I
A
 
C
V
 
S
I
 
L
I
 
N
Y
 
Y
T
x
S
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
G
P
 
P
K
 
K
G
 
G
A
 
I
M
 
P
L
 
H
T
 
A
Y
 
H
K
 
K
N
 
D
-
 
Y
-
 
P
I
 
L
F
 
T
A
 
A
D
 
Q
I
 
L
W
 
W
G
 
G
I
 
V
N
 
N
E
 
-
I
 
V
V
 
L
K
 
G
I
 
L
T
 
R
P
 
E
K
 
S
D
 
D
R
 
R
F
 
T
I
 
F
A
 
A
Y
 
L
L
 
A
P
 
K
M
 
L
F
 
F
H
x
F
S
x
T
F
|
F
T
 
G
M
 
T
T
 
G
V
 
G
N
 
N
I
 
L
L
 
I
L
 
F
P
 
P
L
 
W
Y
 
Y
T
 
V
G
 
G
S
 
A
A
 
S
V
 
C
V
 
V
I
 
L
I
 
F
K
 
P
S
 
G
I
 
A
M
 
A
P
 
R
F
 
V
S
 
A
N
 
S
I
 
N
I
 
V
K
 
L
Q
 
S
T
 
T
L
 
I
L
 
S
K
 
R
-
 
F
R
 
K
V
 
P
T
 
T
I
 
I
F
 
F
T
 
Y
G
 
N
V
 
A
P
 
P
D
 
T
V
 
G
Y
 
Y
S
 
A
A
 
A
L
 
-
S
 
A
R
 
L
A
 
A
K
 
L
L
 
K
P
 
D
F
 
F
Y
 
S
F
 
Q
H
 
H
W
 
D
F
 
L
N
 
S
K
 
S
V
 
L
R
 
R
F
 
L
Y
 
C
V
 
V
S
 
S
G
x
A
A
x
S
A
x
E
A
|
A
L
 
L
P
 
P
G
 
A
E
 
A
V
 
L
L
 
W
E
 
Y
R
 
A
F
 
W
S
 
-
K
 
K
K
 
E
F
 
A
K
 
T
K
 
G
A
 
V
K
 
D
L
 
I
L
 
I
E
 
D
G
|
G
Y
x
I
G
|
G
L
x
C
S
x
T
E
|
E
T
 
N
S
 
F
P
 
H
V
 
I
V
 
F
A
 
I
V
 
S
N
 
N
R
 
R
P
 
P
Y
 
G
L
 
D
Q
 
I
K
 
R
P
 
P
G
 
G
S
 
S
V
 
S
G
 
G
P
 
K
A
 
P
I
 
V
P
 
E
G
 
G
V
 
Y
E
 
E
V
 
L
K
 
K
I
 
L
V
 
V
N
 
D
D
 
D
E
 
E
L
 
G
I
 
K
E
 
T
V
 
V
P
 
P
I
 
A
G
 
G
E
 
E
A
 
I
G
 
G
E
 
N
I
 
V
I
 
L
V
 
L
K
 
R
G
 
S
D
 
E
I
 
T
V
 
A
M
 
A
K
 
L
G
 
S
Y
 
Y
Y
 
W
N
 
H
R
 
N
D
 
F
E
 
E
A
 
K
N
 
S
E
 
R
E
 
Q
C
 
T
L
 
F
I
 
Q
N
 
G
G
 
E
W
 
W
F
 
L
L
 
A
T
 
T
G
 
G
D
|
D
I
 
K
G
 
Y
K
 
F
V
 
V
D
 
D
E
 
A
D
 
D
G
 
G
F
 
Y
I
 
Y
Y
 
W
I
x
H
L
 
A
D
 
G
R
|
R
K
 
S
K
 
D
D
 
D
L
 
M
I
 
L
I
x
K
S
 
V
K
 
G
G
 
G
V
 
I
N
x
W
I
 
V
Y
 
S
P
 
P
R
 
V
E
 
E
I
 
V
E
 
E
E
 
S
I
 
T
I
 
L
L
 
I
K
 
Q
F
 
H
P
 
P
G
 
A
I
 
V
K
 
Q
D
 
E
C
 
C
A
 
A
V
 
V
V
 
I
G
 
G
L
 
C
K
 
P
D
 
D
E
 
L
N
 
I
H
 
K
G
 
-
E
 
-
I
 
-
P
 
P
V
 
K
A
 
A
F
 
F
I
 
I
E
 
I
V
 
L
E
 
K
E
 
P
D
 
Q
M
 
I
-
 
P
-
 
S
E
 
E
V
 
A
N
 
L
E
 
I
K
 
R
D
 
Q
L
 
I
R
 
T
K
 
D
Y
 
H
L
 
C
K
 
T
S
 
E
K
 
K
L
 
M
A
 
A
N
 
A
Y
 
Y
K
 
K
L
 
R
P
 
P
K
 
R
Y
 
W
I
 
I
Y
 
E
F
 
F
V
 
V
E
 
T
N
 
E
L
 
L
P
 
P
K
 
K
N
 
T
A
 
A
T
 
T
G
 
G
K
|
K
V
 
I
L
 
Q
K
 
R
R
 
F
I
 
K
L
 
L
R
 
R
E
 
S

O74976 Oxalate--CoA ligase; Oxalyl-CoA synthetase; Peroxisomal-coenzyme A synthetase; EC 6.2.1.8 from Schizosaccharomyces pombe (strain 972 / ATCC 24843) (Fission yeast) (see paper)
30% identity, 92% coverage: 29:506/519 of query aligns to 25:500/512 of O74976

query
sites
O74976
D
 
N
K
 
A
K
 
E
I
 
L
S
 
S
W
 
F
Q
 
S
D
 
E
V
 
L
K
 
R
K
 
I
K
 
A
V
 
I
D
 
M
T
 
D
F
 
L
A
 
Q
R
 
R
T
 
Q
L
 
I
E
 
A
L
 
S
L
 
L
G
 
G
I
 
I
K
 
K
K
 
V
G
 
G
D
 
D
K
 
P
I
 
V
P
 
N
I
 
I
Y
 
A
V
 
I
N
 
P
N
 
N
S
 
G
L
 
L
E
 
E
F
 
F
V
 
V
I
 
V
A
 
A
L
 
F
F
 
Y
G
 
A
I
 
V
Q
 
S
K
 
W
I
 
Q
G
 
R
A
 
A
V
 
I
P
 
C
V
 
G
P
 
P
I
 
L
N
 
N
T
 
S
F
 
N
L
 
Y
K
 
K
E
 
Q
D
 
S
E
 
E
I
 
F
S
 
E
F
 
F
I
 
Y
L
 
I
N
 
D
D
 
D
I
 
L
E
 
K
A
 
S
E
 
K
F
 
L
L
 
V
I
 
I
A
 
V
S
 
P
-
 
E
S
 
G
K
 
S
F
 
V
E
 
A
K
 
A
N
 
N
I
 
T
P
 
P
N
 
A
I
 
V
R
 
R
E
 
A
-
 
A
-
 
K
-
 
K
-
 
L
K
 
S
T
 
V
S
 
A
V
 
V
K
 
A
K
 
E
I
 
L
I
 
A
W
 
W
E
 
C
G
 
P
E
 
K
P
 
S
S
 
R
I
 
L
I
 
V
D
 
R
E
 
I
D
 
V
N
 
H
I
 
F
S
 
E
F
 
G
T
 
A
E
 
K
I
 
I
L
 
N
S
 
A
N
 
P
I
 
-
E
 
-
P
 
-
H
 
-
E
 
Q
S
 
P
I
 
L
E
 
G
Y
 
L
P
 
P
T
 
Q
L
 
P
D
 
D
D
 
D
L
 
V
A
 
M
V
 
L
I
 
V
I
 
L
Y
 
H
T
 
T
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
R
P
 
P
K
 
K
G
 
V
A
 
V
M
 
P
L
 
L
T
 
T
Y
 
H
K
 
K
N
 
N
I
 
L
F
 
C
A
 
R
D
 
S
I
 
I
W
 
H
G
 
N
I
 
I
N
 
T
E
 
T
I
 
S
V
 
Y
K
 
R
I
 
L
T
 
D
P
 
P
K
 
R
D
 
D
R
 
T
F
 
S
I
 
Y
A
 
V
Y
 
V
L
 
M
P
 
P
M
 
L
F
 
F
H
 
H
S
 
V
F
 
H
T
 
G
M
 
L
T
 
L
V
 
C
N
 
G
I
 
L
L
 
L
L
 
S
P
 
T
L
 
L
Y
 
A
T
 
S
G
 
G
S
 
G
A
 
C
V
 
A
V
 
V
I
 
V
I
 
P
K
 
P
S
 
K
I
 
F
M
 
S
P
 
A
F
 
H
S
 
S
N
 
-
I
 
F
I
 
W
K
 
K
Q
 
E
T
 
F
L
 
I
L
 
Q
K
 
Y
R
 
G
V
 
A
T
 
T
I
 
W
F
 
Y
T
 
T
G
 
A
V
 
V
P
 
P
D
 
T
V
 
I
Y
 
H
S
 
Q
A
 
I
L
 
L
S
 
L
R
 
R
A
 
T
K
 
P
L
 
P
P
 
P
F
 
-
Y
 
-
F
 
-
H
 
K
W
 
P
F
 
L
N
 
P
K
 
R
V
 
I
R
 
R
F
 
F
Y
 
I
V
 
R
S
 
S
G
 
C
A
x
S
A
x
S
A
 
P
L
 
L
P
 
A
G
 
P
E
 
P
V
 
V
L
 
L
E
 
S
R
 
K
F
 
L
S
 
E
K
 
A
K
 
T
F
 
F
K
 
R
K
 
-
A
 
A
K
 
P
L
 
V
L
 
L
E
 
E
G
 
A
Y
 
Y
G
 
A
L
 
M
S
 
T
E
 
E
T
 
A
S
 
S
P
 
H
V
 
Q
V
 
M
A
 
T
V
 
T
N
 
N
R
 
P
-
 
L
-
 
P
P
 
P
Y
 
L
L
 
V
Q
 
H
K
 
K
P
 
P
G
 
H
S
 
S
V
 
V
G
 
G
P
 
K
A
 
P
I
 
F
P
 
-
G
 
G
V
 
V
E
 
E
V
 
L
K
 
K
I
 
I
V
 
L
N
 
D
D
 
Q
E
 
K
L
 
G
I
 
N
E
 
E
V
 
M
P
 
P
I
 
Q
G
 
G
E
 
K
A
 
E
G
 
G
E
 
E
I
 
I
I
 
C
V
 
V
K
 
R
G
 
G
D
 
I
I
 
N
V
 
V
M
 
T
K
 
K
G
 
G
Y
 
Y
Y
 
L
N
 
N
R
 
N
D
 
P
E
 
A
A
 
A
N
 
N
E
 
K
E
 
S
C
 
S
L
 
F
I
 
T
-
 
K
N
 
D
G
 
R
W
 
F
F
 
F
L
 
R
T
 
T
G
 
G
D
 
D
I
 
E
G
 
G
K
 
K
V
 
L
D
 
D
E
 
K
D
 
D
G
 
G
F
 
Y
I
 
V
Y
 
F
I
 
I
L
 
T
D
 
G
R
 
R
K
 
I
K
 
K
D
 
E
L
 
L
I
 
V
I
 
N
S
 
R
K
 
G
G
 
G
V
 
E
N
 
K
I
 
I
Y
 
S
P
 
P
R
 
A
E
 
E
I
 
I
E
 
D
E
 
A
I
 
V
I
 
L
L
 
M
K
 
Q
F
 
H
P
 
P
G
 
D
I
 
V
K
 
S
D
 
E
C
 
A
A
 
V
V
 
C
V
 
F
G
 
A
L
 
V
K
 
P
D
 
D
E
 
E
N
 
K
H
 
Y
G
 
G
E
 
Q
I
 
D
P
 
I
V
 
Q
A
 
A
F
 
A
I
 
I
E
 
N
V
 
P
E
 
V
E
 
A
D
 
G
M
 
K
E
 
T
V
 
V
N
 
T
E
 
P
K
 
K
D
 
Q
L
 
L
R
 
H
K
 
D
Y
 
Y
L
 
L
K
 
E
S
 
Q
K
 
K
L
 
V
A
 
A
N
 
A
Y
 
F
K
 
K
L
 
I
P
 
P
K
 
K
Y
 
K
I
 
F
Y
 
Y
F
 
F
V
 
T
E
 
D
N
 
R
L
 
I
P
 
P
K
 
K
N
 
T
A
 
A
T
 
T
G
 
G
K
 
K
V
 
V
L
 
Q
K
 
R
R
 
R
I
 
L
L
 
V

3ni2A Crystal structures and enzymatic mechanisms of a populus tomentosa 4- coumarate:coa ligase (see paper)
33% identity, 92% coverage: 33:508/519 of query aligns to 47:527/528 of 3ni2A

query
sites
3ni2A
S
 
T
W
 
Y
Q
 
A
D
 
D
V
 
V
K
 
E
K
 
L
K
 
T
V
 
A
D
 
R
T
 
R
F
 
V
A
 
A
R
 
S
T
 
G
L
 
L
E
 
N
L
 
K
L
 
I
G
 
G
I
 
I
K
 
Q
K
 
Q
G
 
G
D
 
D
K
 
V
I
 
I
P
 
M
I
 
L
Y
 
F
V
 
L
N
 
P
N
 
S
S
 
S
L
 
P
E
 
E
F
 
F
V
 
V
I
 
L
A
 
A
L
 
F
F
 
L
G
 
G
I
 
A
Q
 
S
K
 
H
I
 
R
G
 
G
A
 
A
V
 
I
P
 
I
V
 
T
P
 
A
I
 
A
N
 
N
T
 
P
F
 
F
L
 
S
K
 
T
E
 
P
D
 
A
E
 
E
I
 
L
S
 
A
F
 
K
I
 
H
L
 
A
N
 
K
D
 
A
I
 
S
E
 
R
A
 
A
E
 
K
F
 
L
L
 
L
I
 
I
A
 
T
S
 
Q
S
 
A
K
 
C
F
 
Y
E
 
Y
K
 
E
N
 
K
I
 
V
P
 
K
N
 
D
I
 
F
R
 
A
E
 
R
K
 
E
T
 
S
S
 
D
V
 
V
K
 
K
K
 
V
I
 
M
I
 
C
W
 
V
E
 
D
G
 
S
E
 
A
P
 
P
S
 
-
I
 
-
I
 
-
D
 
-
E
 
D
D
 
G
N
 
C
I
 
L
S
 
H
F
 
F
T
 
S
E
 
E
I
 
L
L
 
T
S
 
Q
-
 
A
-
 
D
-
 
E
N
 
N
I
 
E
E
 
A
P
 
P
H
 
Q
E
 
V
S
 
D
I
 
I
E
 
-
Y
 
-
P
 
-
T
 
S
L
 
P
D
 
D
D
 
D
L
 
V
A
 
V
V
 
A
I
 
L
I
 
P
Y
 
Y
T
x
S
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
L
P
 
P
K
 
K
G
 
G
A
 
V
M
 
M
L
 
L
T
 
T
Y
 
H
K
 
K
N
 
G
I
 
L
F
 
I
A
 
T
D
x
S
I
 
V
W
 
A
-
 
Q
-
 
Q
-
 
V
-
 
D
G
 
G
I
 
D
N
 
N
E
 
P
I
 
N
V
 
L
K
 
Y
I
 
F
T
 
H
P
 
S
K
 
E
D
 
D
R
 
V
F
 
I
I
 
L
A
 
C
Y
 
V
L
 
L
P
 
P
M
 
M
F
 
F
H
|
H
S
 
I
F
x
Y
T
 
A
M
 
L
T
 
N
V
x
S
N
 
I
I
 
M
L
 
L
L
 
C
P
 
G
L
 
L
Y
 
R
T
 
V
G
 
G
S
 
A
A
 
P
V
 
I
V
 
L
I
 
I
I
 
M
K
 
P
-
 
K
-
 
F
S
 
E
I
 
I
M
 
G
P
 
S
F
 
L
S
 
L
N
 
G
I
 
L
I
 
I
K
 
E
Q
 
K
T
 
Y
L
 
-
L
 
-
K
 
-
R
 
K
V
 
V
T
 
S
I
 
I
F
 
A
T
 
P
G
 
V
V
 
V
P
 
P
D
 
P
V
 
V
Y
 
M
S
 
-
A
 
-
L
 
M
S
 
S
R
 
I
A
 
A
K
 
K
L
 
S
P
 
P
-
 
D
F
 
L
Y
 
D
F
 
K
H
 
H
W
 
D
F
 
L
N
 
S
K
 
S
V
 
L
R
 
R
F
 
M
Y
 
I
V
 
K
S
 
S
G
 
G
A
x
G
A
|
A
A
x
P
L
 
L
P
 
G
G
 
K
E
 
E
V
 
L
L
 
E
E
 
D
R
 
T
F
 
V
S
 
R
K
 
A
K
 
K
F
 
F
K
 
P
K
 
Q
A
 
A
K
 
R
L
 
L
L
 
G
E
 
Q
G
|
G
Y
 
Y
G
|
G
L
 
M
S
x
T
E
|
E
T
 
A
S
 
G
P
|
P
V
|
V
V
 
L
A
 
A
V
 
M
-
 
C
-
 
L
-
 
A
-
 
F
-
 
A
N
 
K
R
 
E
P
 
P
Y
 
F
L
 
D
Q
 
I
K
 
K
P
 
P
G
 
G
S
 
A
V
 
C
G
 
G
P
 
T
A
 
V
I
 
V
P
 
R
G
 
N
V
 
A
E
 
E
V
 
M
K
 
K
I
 
I
V
 
V
N
 
D
D
 
P
E
 
E
L
 
T
-
 
G
I
 
A
E
 
S
V
 
L
P
 
P
I
 
R
G
 
N
E
 
Q
A
 
P
G
 
G
E
 
E
I
 
I
I
 
C
V
 
I
K
 
R
G
 
G
D
 
D
I
 
Q
V
 
I
M
 
M
K
 
K
G
 
G
Y
 
Y
Y
 
L
N
 
N
R
 
D
D
 
P
E
 
E
A
 
A
N
 
T
E
 
S
E
 
R
C
 
T
L
 
I
-
 
D
I
 
K
N
 
E
G
 
G
W
 
W
F
 
L
L
 
H
T
 
T
G
 
G
D
|
D
I
 
I
G
 
G
K
 
Y
V
 
I
D
 
D
E
 
D
D
 
D
G
 
D
F
 
E
I
 
L
Y
 
F
I
 
I
L
 
V
D
 
D
R
 
R
K
 
L
K
|
K
D
 
E
L
 
L
I
 
I
I
x
K
S
 
Y
K
 
K
G
 
G
V
 
F
N
x
Q
I
 
V
Y
 
A
P
 
P
R
 
A
E
 
E
I
 
L
E
 
E
E
 
A
I
 
L
I
 
L
L
 
I
K
 
A
F
 
H
P
 
P
G
 
E
I
 
I
K
 
S
D
 
D
C
 
A
A
 
A
V
 
V
V
 
V
G
 
G
L
 
L
K
 
K
D
 
D
E
 
E
N
 
D
H
 
A
G
 
G
E
 
E
I
 
V
P
 
P
V
 
V
A
 
A
F
 
F
I
 
V
E
 
V
V
 
K
E
 
S
E
 
E
D
 
K
M
 
S
E
 
Q
V
 
A
N
 
T
E
 
E
K
 
D
D
 
E
L
 
I
R
 
K
K
 
Q
Y
 
Y
L
 
I
K
 
S
S
 
K
K
 
Q
L
 
V
A
 
I
N
 
F
Y
 
Y
K
 
K
L
 
R
P
 
I
K
 
K
Y
 
R
I
 
V
Y
 
F
F
 
F
V
 
I
E
 
E
N
 
A
L
 
I
P
 
P
K
 
K
N
 
A
A
 
P
T
 
S
G
 
G
K
|
K
V
 
I
L
 
L
K
 
R
R
 
K
I
 
N
L
 
L
R
 
K
E
 
E

3a9vA Crystal structures and enzymatic mechanisms of a populus tomentosa 4- coumarate--coa ligase (see paper)
33% identity, 92% coverage: 33:508/519 of query aligns to 47:527/528 of 3a9vA

query
sites
3a9vA
S
 
T
W
 
Y
Q
 
A
D
 
D
V
 
V
K
 
E
K
 
L
K
 
T
V
 
A
D
 
R
T
 
R
F
 
V
A
 
A
R
 
S
T
 
G
L
 
L
E
 
N
L
 
K
L
 
I
G
 
G
I
 
I
K
 
Q
K
 
Q
G
 
G
D
 
D
K
 
V
I
 
I
P
 
M
I
 
L
Y
 
F
V
 
L
N
 
P
N
 
S
S
 
S
L
 
P
E
 
E
F
 
F
V
 
V
I
 
L
A
 
A
L
 
F
F
 
L
G
 
G
I
 
A
Q
 
S
K
 
H
I
 
R
G
 
G
A
 
A
V
 
I
P
 
I
V
 
T
P
 
A
I
 
A
N
 
N
T
 
P
F
 
F
L
 
S
K
 
T
E
 
P
D
 
A
E
 
E
I
 
L
S
 
A
F
 
K
I
 
H
L
 
A
N
 
K
D
 
A
I
 
S
E
 
R
A
 
A
E
 
K
F
 
L
L
 
L
I
 
I
A
 
T
S
 
Q
S
 
A
K
 
C
F
 
Y
E
 
Y
K
 
E
N
 
K
I
 
V
P
 
K
N
 
D
I
 
F
R
 
A
E
 
R
K
 
E
T
 
S
S
 
D
V
 
V
K
 
K
K
 
V
I
 
M
I
 
C
W
 
V
E
 
D
G
 
S
E
 
A
P
 
P
S
 
-
I
 
-
I
 
-
D
 
-
E
 
D
D
 
G
N
 
C
I
 
L
S
 
H
F
 
F
T
 
S
E
 
E
I
 
L
L
 
T
S
 
Q
-
 
A
-
 
D
-
 
E
N
 
N
I
 
E
E
 
A
P
 
P
H
 
Q
E
 
V
S
 
D
I
 
I
E
 
-
Y
 
-
P
 
-
T
 
S
L
 
P
D
 
D
D
 
D
L
 
V
A
 
V
V
 
A
I
 
L
I
 
P
Y
 
Y
T
x
S
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
L
P
 
P
K
 
K
G
 
G
A
 
V
M
 
M
L
 
L
T
 
T
Y
 
H
K
 
K
N
 
G
I
 
L
F
 
I
A
 
T
D
x
S
I
 
V
W
 
A
-
 
Q
-
 
Q
-
 
V
-
 
D
G
 
G
I
 
D
N
 
N
E
 
P
I
 
N
V
 
L
K
 
Y
I
 
F
T
 
H
P
 
S
K
 
E
D
 
D
R
 
V
F
 
I
I
 
L
A
 
C
Y
 
V
L
 
L
P
 
P
M
 
M
F
 
F
H
|
H
S
 
I
F
 
Y
T
 
A
M
 
L
T
 
N
V
 
S
N
 
I
I
 
M
L
 
L
L
 
C
P
 
G
L
 
L
Y
 
R
T
 
V
G
 
G
S
 
A
A
 
P
V
 
I
V
 
L
I
 
I
I
 
M
K
 
P
-
 
K
-
 
F
S
 
E
I
 
I
M
 
G
P
 
S
F
 
L
S
 
L
N
 
G
I
 
L
I
 
I
K
 
E
Q
 
K
T
 
Y
L
 
-
L
 
-
K
 
-
R
 
K
V
 
V
T
 
S
I
 
I
F
 
A
T
 
P
G
 
V
V
 
V
P
 
P
D
 
P
V
 
V
Y
 
M
S
 
-
A
 
-
L
 
M
S
 
S
R
 
I
A
 
A
K
 
K
L
 
S
P
 
P
-
 
D
F
 
L
Y
 
D
F
 
K
H
 
H
W
 
D
F
 
L
N
 
S
K
 
S
V
 
L
R
 
R
F
 
M
Y
 
I
V
 
K
S
 
S
G
 
G
A
x
G
A
|
A
A
x
P
L
 
L
P
 
G
G
 
K
E
 
E
V
 
L
L
 
E
E
 
D
R
 
T
F
 
V
S
 
R
K
 
A
K
 
K
F
 
F
K
 
P
K
 
Q
A
 
A
K
 
R
L
 
L
L
 
G
E
 
Q
G
 
G
Y
|
Y
G
|
G
L
x
M
S
x
T
E
|
E
T
 
A
S
 
G
P
 
P
V
 
V
V
 
L
A
 
A
V
 
M
-
 
C
-
 
L
-
 
A
-
 
F
-
 
A
N
 
K
R
 
E
P
 
P
Y
 
F
L
 
D
Q
 
I
K
 
K
P
 
P
G
 
G
S
 
A
V
 
C
G
 
G
P
 
T
A
 
V
I
 
V
P
 
R
G
 
N
V
 
A
E
 
E
V
 
M
K
 
K
I
 
I
V
 
V
N
 
D
D
 
P
E
 
E
L
 
T
-
 
G
I
 
A
E
 
S
V
 
L
P
 
P
I
 
R
G
 
N
E
 
Q
A
 
P
G
 
G
E
 
E
I
 
I
I
 
C
V
 
I
K
 
R
G
 
G
D
 
D
I
 
Q
V
 
I
M
 
M
K
 
K
G
 
G
Y
 
Y
Y
 
L
N
 
N
R
 
D
D
 
P
E
 
E
A
 
A
N
 
T
E
 
S
E
 
R
C
 
T
L
 
I
-
 
D
I
 
K
N
 
E
G
 
G
W
 
W
F
 
L
L
 
H
T
 
T
G
 
G
D
|
D
I
 
I
G
 
G
K
 
Y
V
 
I
D
 
D
E
 
D
D
 
D
G
 
D
F
 
E
I
 
L
Y
 
F
I
 
I
L
 
V
D
 
D
R
 
R
K
 
L
K
|
K
D
 
E
L
 
L
I
 
I
I
x
K
S
 
Y
K
 
K
G
 
G
V
 
F
N
x
Q
I
 
V
Y
 
A
P
 
P
R
 
A
E
 
E
I
 
L
E
 
E
E
 
A
I
 
L
I
 
L
L
 
I
K
 
A
F
 
H
P
 
P
G
 
E
I
 
I
K
 
S
D
 
D
C
 
A
A
 
A
V
 
V
V
 
V
G
 
G
L
 
L
K
 
K
D
 
D
E
 
E
N
 
D
H
 
A
G
 
G
E
 
E
I
 
V
P
 
P
V
 
V
A
 
A
F
 
F
I
 
V
E
 
V
V
 
K
E
 
S
E
 
E
D
 
K
M
 
S
E
 
Q
V
 
A
N
 
T
E
 
E
K
 
D
D
 
E
L
 
I
R
 
K
K
 
Q
Y
 
Y
L
 
I
K
 
S
S
 
K
K
 
Q
L
 
V
A
 
I
N
 
F
Y
 
Y
K
 
K
L
 
R
P
 
I
K
 
K
Y
 
R
I
 
V
Y
 
F
F
 
F
V
 
I
E
 
E
N
 
A
L
 
I
P
 
P
K
 
K
N
 
A
A
 
P
T
 
S
G
 
G
K
|
K
V
 
I
L
 
L
K
 
R
R
 
K
I
 
N
L
 
L
R
 
K
E
 
E

5x8fB Ternary complex structure of a double mutant i454ra456k of o- succinylbenzoate coa synthetase (mene) from bacillus subtilis bound with amp and its product analogue osb-ncoa at 1.76 angstrom (see paper)
31% identity, 96% coverage: 12:508/519 of query aligns to 8:478/485 of 5x8fB

query
sites
5x8fB
L
 
L
E
 
M
K
 
Q
N
 
R
A
 
A
K
 
Q
E
 
L
I
 
T
G
 
P
K
 
E
K
 
R
T
 
I
A
 
A
Y
 
L
F
 
I
I
x
Y
D
x
E
D
 
D
K
 
Q
K
 
T
I
 
V
S
 
T
W
 
F
Q
 
A
D
 
E
V
 
L
K
 
F
K
 
A
K
 
A
V
 
S
D
 
K
T
 
R
F
 
M
A
 
A
R
 
E
T
 
Q
L
 
L
E
 
A
L
 
A
L
 
H
G
 
S
I
 
V
K
 
R
K
 
K
G
 
G
D
 
D
K
 
T
I
 
A
P
 
A
I
 
I
Y
 
L
V
 
L
N
 
Q
N
 
N
S
 
R
L
 
A
E
 
E
F
 
M
V
 
V
I
 
Y
A
 
A
L
 
V
F
x
H
G
 
A
I
 
C
Q
 
F
K
 
L
I
 
L
G
 
G
A
 
V
V
 
K
P
 
A
V
 
V
P
 
L
I
 
L
N
 
N
T
 
T
F
x
K
L
 
L
K
 
S
E
 
T
D
 
H
E
 
E
I
 
R
S
 
L
F
 
F
I
 
Q
L
 
L
N
 
E
D
 
D
I
 
S
E
 
G
A
 
S
E
 
G
F
 
F
L
 
L
I
 
L
A
 
T
S
 
D
S
 
S
K
 
S
F
 
F
E
 
E
K
 
K
N
 
K
I
 
E
P
 
-
N
 
-
I
 
-
R
 
-
E
 
-
K
 
-
T
 
-
S
 
-
V
 
-
K
 
-
K
 
-
I
 
-
I
 
-
W
 
Y
E
 
E
G
 
H
E
 
I
P
 
V
S
 
Q
I
 
T
I
 
I
D
 
D
E
 
V
D
 
D
N
 
E
I
 
L
S
 
-
F
 
-
T
 
-
E
 
-
I
 
M
L
 
K
S
 
E
N
 
A
I
 
A
E
 
E
P
 
E
H
 
I
E
 
E
S
 
I
I
 
E
E
 
A
Y
 
Y
P
 
M
T
 
Q
L
 
M
D
 
D
D
 
A
L
 
T
A
 
A
V
 
T
I
 
L
I
 
M
Y
 
Y
T
|
T
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
K
P
 
P
K
 
K
G
 
G
A
 
V
M
 
Q
L
 
Q
T
 
T
Y
 
F
K
 
G
N
 
N
I
 
H
F
 
Y
A
 
F
D
x
S
I
 
A
W
 
V
G
 
S
I
 
S
N
 
A
E
 
L
I
x
N
V
 
L
K
 
G
I
 
I
T
 
T
P
 
E
K
 
Q
D
 
D
R
 
R
F
 
W
I
 
L
A
 
I
Y
 
A
L
|
L
P
|
P
M
 
L
F
 
F
H
|
H
S
x
I
F
x
S
T
 
G
M
 
L
T
 
S
V
 
A
N
x
L
I
 
F
L
 
K
L
 
S
P
 
V
L
 
I
Y
 
Y
T
 
-
G
 
-
S
 
G
A
 
M
V
 
T
V
 
V
I
 
V
I
x
L
K
 
H
S
 
Q
I
 
R
M
 
F
P
 
S
F
 
V
S
 
S
N
 
D
I
 
V
I
 
L
K
 
H
Q
 
S
T
 
I
L
 
N
L
 
R
K
 
H
R
 
E
V
 
V
T
 
T
I
 
M
F
 
I
T
 
S
G
x
A
V
|
V
P
 
Q
D
 
T
V
 
M
Y
 
L
S
 
A
A
 
S
L
 
L
-
 
L
-
 
E
S
 
E
R
 
T
A
 
N
K
 
R
L
 
C
P
 
P
F
 
-
Y
 
-
F
 
-
H
 
-
W
 
-
F
 
-
N
 
E
K
 
S
V
 
I
R
 
R
F
 
C
Y
 
I
V
x
L
S
 
L
G
|
G
A
 
G
A
 
G
A
 
P
L
 
A
P
 
P
G
 
L
E
 
P
V
 
L
L
 
L
E
 
E
R
 
E
F
 
C
S
 
R
K
 
E
K
 
K
F
 
-
K
 
-
K
 
G
A
 
F
K
 
P
L
 
V
L
 
F
E
 
Q
G
 
S
Y
 
Y
G
|
G
L
x
M
S
x
T
E
|
E
T
 
T
S
 
C
P
x
S
V
x
Q
V
 
I
A
 
V
V
x
T
N
x
L
R
x
S
P
 
P
-
 
E
-
 
F
Y
 
S
L
 
M
Q
 
E
K
 
K
P
 
L
G
 
G
S
 
S
V
 
A
G
 
G
P
 
K
A
 
P
I
 
L
P
 
F
G
 
S
V
 
C
E
 
E
V
 
I
K
 
K
I
 
I
V
 
E
N
 
R
D
 
D
E
 
G
L
 
Q
I
 
V
E
 
C
V
 
E
P
 
P
I
 
Y
G
 
-
E
 
E
A
 
H
G
 
G
E
 
E
I
 
I
I
 
M
V
 
V
K
 
K
G
 
G
D
 
P
I
 
N
V
 
V
M
 
M
K
 
K
G
 
S
Y
 
Y
Y
 
F
N
 
N
R
 
R
D
 
E
E
 
S
A
 
A
N
 
N
E
 
E
E
 
A
C
 
S
L
 
F
I
 
Q
N
 
N
G
 
G
W
 
W
F
 
L
L
 
K
T
 
T
G
 
G
D
 
D
I
 
L
G
 
G
K
 
Y
V
 
L
D
 
D
E
 
N
D
 
E
G
 
G
F
 
F
I
 
L
Y
 
Y
I
 
V
L
 
L
D
 
D
R
 
R
K
 
R
K
 
S
D
 
D
L
 
L
I
 
I
I
|
I
S
|
S
K
x
G
G
|
G
V
x
E
N
|
N
I
 
I
Y
 
Y
P
 
P
R
 
A
E
 
E
I
 
V
E
 
E
E
 
S
I
 
V
I
 
L
L
 
L
K
 
S
F
 
H
P
 
P
G
 
A
I
 
V
K
 
A
D
 
E
C
 
A
A
 
G
V
 
V
V
 
S
G
 
G
L
 
A
K
 
E
D
 
D
E
 
K
N
x
K
H
x
W
G
 
G
E
 
K
I
 
V
P
 
P
V
 
H
A
 
A
F
 
Y
I
 
L
E
 
V
V
 
L
E
 
H
E
 
K
D
 
P
M
 
V
E
 
S
V
 
A
N
 
G
E
 
E
K
 
-
D
 
-
L
 
L
R
 
T
K
 
D
Y
 
Y
L
 
C
K
 
K
S
 
E
K
 
R
L
 
L
A
 
A
N
x
K
Y
|
Y
K
 
K
L
 
R
P
 
P
K
 
K
Y
 
K
I
 
F
Y
 
F
F
 
V
V
 
L
E
 
D
N
 
R
L
 
L
P
 
P
K
 
R
N
 
N
A
 
A
T
 
S
G
 
N
K
|
K
V
 
L
L
 
L
K
 
R
R
 
N
I
 
Q
L
 
L
R
 
K
E
 
D

5gtdA O-succinylbenzoate coa synthetase (mene) from bacillus subtilis in complex with the acyl-adenylate intermediate osb-amp (see paper)
31% identity, 96% coverage: 12:508/519 of query aligns to 8:478/484 of 5gtdA

query
sites
5gtdA
L
 
L
E
 
M
K
 
Q
N
 
R
A
 
A
K
 
Q
E
 
L
I
 
T
G
 
P
K
 
E
K
 
R
T
 
I
A
 
A
Y
 
L
F
 
I
I
 
Y
D
 
E
D
 
D
K
 
Q
K
 
T
I
 
V
S
 
T
W
 
F
Q
 
A
D
 
E
V
 
L
K
 
F
K
 
A
K
 
A
V
 
S
D
 
K
T
 
R
F
 
M
A
 
A
R
 
E
T
 
Q
L
 
L
E
 
A
L
 
A
L
 
H
G
 
S
I
 
V
K
 
R
K
 
K
G
 
G
D
 
D
K
 
T
I
 
A
P
 
A
I
 
I
Y
 
L
V
 
L
N
 
Q
N
 
N
S
 
R
L
 
A
E
 
E
F
 
M
V
 
V
I
 
Y
A
 
A
L
 
V
F
 
H
G
 
A
I
 
C
Q
 
F
K
 
L
I
 
L
G
 
G
A
 
V
V
 
K
P
 
A
V
 
V
P
 
L
I
 
L
N
 
N
T
 
T
F
 
K
L
 
L
K
 
S
E
 
T
D
 
H
E
 
E
I
 
R
S
 
L
F
 
F
I
 
Q
L
 
L
N
 
E
D
 
D
I
 
S
E
 
G
A
 
S
E
 
G
F
 
F
L
 
L
I
 
L
A
 
T
S
 
D
S
 
S
K
 
S
F
 
F
E
 
E
K
 
K
N
 
K
I
 
E
P
 
-
N
 
-
I
 
-
R
 
-
E
 
-
K
 
-
T
 
-
S
 
-
V
 
-
K
 
-
K
 
-
I
 
-
I
 
-
W
 
Y
E
 
E
G
 
H
E
 
I
P
 
V
S
 
Q
I
 
T
I
 
I
D
 
D
E
 
V
D
 
D
N
 
E
I
 
L
S
 
-
F
 
-
T
 
-
E
 
-
I
 
M
L
 
K
S
 
E
N
 
A
I
 
A
E
 
E
P
 
E
H
 
I
E
 
E
S
 
I
I
 
E
E
 
A
Y
 
Y
P
 
M
T
 
Q
L
 
M
D
 
D
D
 
A
L
 
T
A
 
A
V
 
T
I
 
L
I
 
M
Y
 
Y
T
|
T
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
K
P
 
P
K
 
K
G
 
G
A
 
V
M
 
Q
L
 
Q
T
 
T
Y
 
F
K
 
G
N
 
N
I
 
H
F
 
Y
A
 
F
D
x
S
I
 
A
W
 
V
G
 
S
I
 
S
N
 
A
E
 
L
I
 
N
V
 
L
K
 
G
I
 
I
T
 
T
P
 
E
K
 
Q
D
 
D
R
 
R
F
 
W
I
 
L
A
 
I
Y
 
A
L
 
L
P
 
P
M
 
L
F
 
F
H
|
H
S
 
I
F
x
S
T
 
G
M
 
L
T
 
S
V
 
A
N
 
L
I
 
F
L
 
K
L
 
S
P
 
V
L
 
I
Y
 
Y
T
 
-
G
 
-
S
 
G
A
 
M
V
 
T
V
 
V
I
 
V
I
 
L
K
 
H
S
 
Q
I
 
R
M
 
F
P
 
S
F
 
V
S
 
S
N
 
D
I
 
V
I
 
L
K
 
H
Q
 
S
T
 
I
L
 
N
L
 
R
K
 
H
R
 
E
V
 
V
T
 
T
I
 
M
F
 
I
T
 
S
G
x
A
V
 
V
P
 
Q
D
 
T
V
 
M
Y
 
L
S
 
A
A
 
S
L
 
L
-
 
L
-
 
E
S
 
E
R
 
T
A
 
N
K
 
R
L
 
C
P
 
P
F
 
-
Y
 
-
F
 
-
H
 
-
W
 
-
F
 
-
N
 
E
K
 
S
V
 
I
R
 
R
F
 
C
Y
 
I
V
x
L
S
 
L
G
|
G
A
x
G
A
x
G
A
 
P
L
 
A
P
 
P
G
 
L
E
 
P
V
 
L
L
 
L
E
 
E
R
 
E
F
 
C
S
 
R
K
 
E
K
 
K
F
 
-
K
 
-
K
 
G
A
 
F
K
 
P
L
 
V
L
 
F
E
 
Q
G
 
S
Y
|
Y
G
|
G
L
x
M
S
x
T
E
|
E
T
 
T
S
 
C
P
x
S
V
x
Q
V
 
I
A
 
V
V
 
T
N
 
L
R
 
S
P
 
P
-
 
E
-
 
F
Y
 
S
L
 
M
Q
 
E
K
 
K
P
 
L
G
 
G
S
 
S
V
 
A
G
 
G
P
 
K
A
 
P
I
 
L
P
x
F
G
x
S
V
 
C
E
 
E
V
 
I
K
 
K
I
 
I
V
 
E
N
 
R
D
 
D
E
 
G
L
 
Q
I
 
V
E
 
C
V
 
E
P
 
P
I
 
Y
G
 
-
E
 
E
A
 
H
G
 
G
E
 
E
I
 
I
I
 
M
V
 
V
K
 
K
G
 
G
D
 
P
I
 
N
V
 
V
M
 
M
K
 
K
G
 
S
Y
 
Y
Y
 
F
N
 
N
R
 
R
D
 
E
E
 
S
A
 
A
N
 
N
E
 
E
E
 
A
C
 
S
L
 
F
I
 
Q
N
 
N
G
 
G
W
 
W
F
 
L
L
 
K
T
 
T
G
 
G
D
|
D
I
 
L
G
 
G
K
 
Y
V
 
L
D
 
D
E
 
N
D
 
E
G
 
G
F
 
F
I
 
L
Y
 
Y
I
x
V
L
 
L
D
 
D
R
 
R
K
 
R
K
 
S
D
 
D
L
 
L
I
 
I
I
 
I
S
 
S
K
 
G
G
 
G
V
 
E
N
 
N
I
 
I
Y
 
Y
P
 
P
R
 
A
E
 
E
I
 
V
E
 
E
E
 
S
I
 
V
I
 
L
L
 
L
K
 
S
F
 
H
P
 
P
G
 
A
I
 
V
K
 
A
D
 
E
C
 
A
A
 
G
V
 
V
V
 
S
G
 
G
L
 
A
K
 
E
D
 
D
E
 
K
N
 
K
H
 
W
G
 
G
E
 
K
I
 
V
P
 
P
V
 
H
A
 
A
F
 
Y
I
 
L
E
 
V
V
 
L
E
 
H
E
 
K
D
 
P
M
 
V
E
 
S
V
 
A
N
 
G
E
 
E
K
 
-
D
 
-
L
 
L
R
 
T
K
 
D
Y
 
Y
L
 
C
K
 
K
S
 
E
K
 
R
L
 
L
A
 
A
N
 
K
Y
 
Y
K
 
K
L
 
I
P
 
P
K
 
A
Y
 
K
I
 
F
Y
 
F
F
 
V
V
 
L
E
 
D
N
 
R
L
 
L
P
 
P
K
 
R
N
 
N
A
 
A
T
 
S
G
 
N
K
 
K
V
 
L
L
 
L
K
 
R
R
 
N
I
 
Q
L
 
L
R
 
K
E
 
D

5burA O-succinylbenzoate coenzyme a synthetase (mene) from bacillus subtilis, in complex with atp and magnesium ion (see paper)
31% identity, 96% coverage: 12:508/519 of query aligns to 7:475/475 of 5burA

query
sites
5burA
L
 
L
E
 
M
K
 
Q
N
 
R
A
 
A
K
 
Q
E
 
L
I
 
T
G
 
P
K
 
E
K
 
R
T
 
I
A
 
A
Y
 
L
F
 
I
I
 
Y
D
 
E
D
 
D
K
 
Q
K
 
T
I
 
V
S
 
T
W
 
F
Q
 
A
D
 
E
V
 
L
K
 
F
K
 
A
K
 
A
V
 
S
D
 
K
T
 
R
F
 
M
A
 
A
R
 
E
T
 
Q
L
 
L
E
 
A
L
 
A
L
 
H
G
 
S
I
 
V
K
 
R
K
 
K
G
 
G
D
 
D
K
 
T
I
 
A
P
 
A
I
 
I
Y
 
L
V
 
L
N
 
Q
N
 
N
S
 
R
L
 
A
E
 
E
F
 
M
V
 
V
I
 
Y
A
 
A
L
 
V
F
 
H
G
 
A
I
 
C
Q
 
F
K
 
L
I
 
L
G
 
G
A
 
V
V
 
K
P
 
A
V
 
V
P
 
L
I
 
L
N
 
N
T
 
T
F
 
K
L
 
L
K
 
S
E
 
T
D
 
H
E
 
E
I
 
R
S
 
L
F
 
F
I
 
Q
L
 
L
N
 
E
D
 
D
I
 
S
E
 
G
A
 
S
E
 
G
F
 
F
L
 
L
I
 
L
A
 
T
S
 
D
S
 
S
K
 
S
F
 
F
E
 
E
K
 
K
N
 
K
I
 
E
P
 
-
N
 
-
I
 
-
R
 
-
E
 
-
K
 
-
T
 
-
S
 
-
V
 
-
K
 
-
K
 
-
I
 
-
I
 
-
W
 
Y
E
 
E
G
 
H
E
 
I
P
 
V
S
 
Q
I
 
T
I
 
I
D
 
D
E
 
V
D
 
D
N
 
E
I
 
L
S
 
-
F
 
-
T
 
-
E
 
-
I
 
M
L
 
K
S
 
E
N
 
A
I
 
A
E
 
E
P
 
E
H
 
I
E
 
E
S
 
I
I
 
E
E
 
A
Y
 
Y
P
 
M
T
 
Q
L
 
M
D
 
D
D
 
A
L
 
T
A
 
A
V
 
T
I
 
L
I
 
M
Y
 
Y
T
|
T
S
|
S
G
 
G
T
|
T
T
|
T
G
 
G
K
 
K
P
 
P
K
|
K
G
 
G
A
 
V
M
 
Q
L
 
Q
T
 
T
Y
 
F
K
 
G
N
 
N
I
 
H
F
 
Y
A
 
F
D
x
S
I
 
A
W
 
V
G
 
S
I
 
S
N
 
A
E
 
L
I
 
N
V
 
L
K
 
G
I
 
I
T
 
T
P
 
E
K
 
Q
D
 
D
R
 
R
F
 
W
I
 
L
A
 
I
Y
 
A
L
 
L
P
 
P
M
 
L
F
 
F
H
|
H
S
 
I
F
 
S
T
 
G
M
 
L
T
 
S
V
 
A
N
 
L
I
 
F
L
 
K
L
 
S
P
 
V
L
 
I
Y
 
Y
T
 
-
G
 
-
S
 
G
A
 
M
V
 
T
V
 
V
I
 
V
I
 
L
K
 
H
S
 
Q
I
 
R
M
 
F
P
 
S
F
 
V
S
 
S
N
 
D
I
 
V
I
 
L
K
 
H
Q
 
S
T
 
I
L
 
N
L
 
R
K
 
H
R
 
E
V
 
V
T
 
T
I
 
M
F
 
I
T
 
S
G
 
A
V
 
V
P
 
Q
D
 
T
V
 
M
Y
 
L
S
 
A
A
 
S
L
 
L
-
 
L
-
 
E
S
 
E
R
 
T
A
 
N
K
 
R
L
 
C
P
 
P
F
 
-
Y
 
-
F
 
-
H
 
-
W
 
-
F
 
-
N
 
E
K
 
S
V
 
I
R
 
R
F
 
C
Y
 
I
V
 
L
S
 
L
G
 
G
A
 
G
A
x
G
A
 
P
L
 
A
P
 
P
G
 
L
E
 
P
V
 
L
L
 
L
E
 
E
R
 
E
F
 
C
S
 
R
K
 
E
K
 
K
F
 
-
K
 
-
K
 
G
A
 
F
K
 
P
L
 
V
L
 
F
E
 
Q
G
x
S
Y
 
Y
G
 
G
L
 
M
S
x
T
E
|
E
T
 
T
S
 
C
P
 
S
V
 
Q
V
 
I
A
 
V
V
 
T
N
 
L
R
 
S
P
 
P
-
 
E
-
 
F
Y
 
S
L
 
M
Q
 
E
K
 
K
P
 
L
G
 
G
S
 
S
V
 
A
G
 
G
P
 
K
A
 
P
I
 
L
P
 
F
G
 
S
V
 
C
E
 
E
V
 
I
K
 
K
I
 
I
V
 
E
N
 
R
D
 
D
E
 
G
L
 
Q
I
 
V
E
 
C
V
 
E
P
 
P
I
 
Y
G
 
-
E
 
E
A
 
H
G
 
G
E
 
E
I
 
I
I
 
M
V
 
V
K
 
K
G
 
G
D
 
P
I
 
N
V
 
V
M
 
M
K
 
K
G
 
S
Y
 
Y
Y
 
F
N
 
N
R
 
R
D
 
E
E
 
S
A
 
A
N
 
N
E
 
E
E
 
A
C
 
S
L
 
F
I
 
Q
N
 
N
G
 
G
W
 
W
F
 
L
L
 
K
T
 
T
G
 
G
D
|
D
I
 
L
G
 
G
K
 
Y
V
 
L
D
 
D
E
 
N
D
 
E
G
 
G
F
 
F
I
 
L
Y
 
Y
I
x
V
L
 
L
D
 
D
R
|
R
K
 
R
K
 
S
D
 
D
L
 
L
I
 
I
I
 
I
S
 
S
K
 
G
G
 
G
V
 
E
N
 
N
I
 
I
Y
 
Y
P
 
P
R
 
A
E
 
E
I
 
V
E
 
E
E
 
S
I
 
V
I
 
L
L
 
L
K
 
S
F
 
H
P
 
P
G
 
A
I
 
V
K
 
A
D
 
E
C
 
A
A
 
G
V
 
V
V
 
S
G
 
G
L
 
A
K
 
E
D
 
D
E
 
K
N
 
-
H
 
-
G
 
G
E
 
K
I
 
V
P
 
P
V
 
H
A
 
A
F
 
Y
I
 
L
E
 
V
V
 
L
E
 
H
E
 
K
D
 
P
M
 
V
E
 
S
V
 
A
N
 
G
E
 
E
K
 
-
D
 
-
L
 
L
R
 
T
K
 
D
Y
 
Y
L
 
C
K
 
K
S
 
E
K
 
R
L
 
L
A
 
A
N
 
K
Y
 
Y
K
 
K
L
 
I
P
 
P
K
 
A
Y
 
K
I
 
F
Y
 
F
F
 
V
V
 
L
E
 
D
N
 
R
L
 
L
P
 
P
K
 
R
N
 
N
A
 
A
T
 
S
G
 
N
K
 
K
V
 
L
L
 
L
K
 
R
R
 
N
I
 
Q
L
 
L
R
 
K
E
 
D

Q67W82 4-coumarate--CoA ligase 4; 4CL 4; Os4CL4; (E)-ferulate--CoA ligase; 4-coumaroyl-CoA synthase 4; Protein RESISTANCE TO ALUMINUM 1; EC 6.2.1.12; EC 6.2.1.34 from Oryza sativa subsp. japonica (Rice) (see paper)
30% identity, 92% coverage: 33:510/519 of query aligns to 61:545/559 of Q67W82

query
sites
Q67W82
S
 
S
W
 
Y
Q
 
G
D
 
E
V
 
V
K
 
E
K
 
E
K
 
L
V
 
S
D
 
R
T
 
R
F
 
A
A
 
A
R
 
A
T
 
G
L
 
L
E
 
R
L
 
R
L
 
L
G
 
G
I
 
V
K
 
G
K
 
K
G
 
G
D
 
D
K
 
V
I
 
V
P
 
M
I
 
S
Y
 
L
V
 
L
N
 
R
N
 
N
S
 
C
L
 
P
E
 
E
F
 
F
V
 
A
I
 
F
A
 
T
L
 
F
F
 
L
G
 
G
I
 
A
Q
 
A
K
 
R
I
 
L
G
 
G
A
 
A
V
 
A
P
 
T
V
 
T
P
 
T
I
 
A
N
 
N
T
 
P
F
 
F
L
 
Y
K
 
T
E
 
P
D
 
H
E
 
E
I
 
I
S
 
H
F
 
R
I
 
Q
L
 
A
N
 
S
D
 
A
I
 
A
E
 
G
A
 
A
E
 
R
F
 
V
L
 
I
I
 
V
A
 
T
S
 
E
S
 
A
K
 
C
F
 
A
E
 
V
K
 
E
N
 
K
I
 
V
P
 
R
N
 
G
I
 
F
R
 
A
E
 
A
K
 
D
T
 
R
S
 
G
V
 
I
K
 
P
K
 
V
I
 
V
I
 
A
W
 
V
E
 
D
G
 
G
E
 
D
P
 
-
S
 
-
I
 
-
I
 
-
D
 
F
E
 
D
D
 
G
N
 
C
I
 
V
S
 
G
F
 
F
T
 
G
E
 
E
I
 
A
L
 
M
-
 
L
-
 
D
S
 
A
N
 
S
I
 
I
E
 
E
P
 
P
H
 
L
E
 
D
S
 
A
I
 
D
E
 
E
Y
 
E
P
 
V
T
 
H
L
 
P
D
 
D
D
 
D
L
 
V
A
 
V
V
 
A
I
 
L
I
 
P
Y
 
Y
T
 
S
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
L
P
 
P
K
 
K
G
 
G
A
 
V
M
 
M
L
 
L
T
 
T
Y
 
H
K
 
R
N
 
S
I
 
L
F
 
V
A
 
T
D
 
S
I
 
V
W
 
A
-
 
Q
-
 
Q
-
 
V
-
 
D
G
 
G
I
 
E
N
 
N
E
 
P
I
 
N
V
 
L
K
 
Y
I
 
F
T
 
R
P
 
R
K
 
E
D
 
D
R
 
V
F
 
V
I
 
L
A
 
C
Y
 
L
L
 
L
P
 
P
M
 
L
F
 
F
H
 
H
S
 
I
F
 
Y
T
 
S
M
 
L
T
 
N
V
 
S
N
 
V
I
 
L
L
 
L
L
 
A
P
 
G
L
 
L
Y
 
R
T
 
A
G
 
G
S
 
S
A
 
A
V
 
I
V
 
V
I
 
I
I
 
M
K
 
R
S
 
K
I
 
-
M
 
F
P
 
D
F
 
L
S
 
G
N
 
A
I
 
L
I
 
V
K
 
D
Q
 
L
T
 
T
L
 
R
L
 
R
K
 
H
R
 
G
V
 
V
T
 
T
I
 
V
F
 
A
T
 
P
G
 
F
V
 
V
P
 
P
D
 
P
V
 
I
Y
 
V
S
 
V
A
 
E
L
 
I
S
 
A
R
 
K
A
 
S
K
 
P
L
 
R
P
 
-
F
 
V
Y
 
T
F
 
A
H
 
D
W
 
D
F
 
L
N
 
A
K
 
S
V
 
I
R
 
R
F
 
M
Y
 
V
V
 
M
S
 
S
G
 
G
A
 
A
A
 
A
A
 
P
L
 
M
P
 
G
G
 
K
E
 
D
V
 
L
L
 
Q
E
 
D
R
 
A
F
 
F
S
 
M
K
 
A
K
 
K
F
 
I
K
 
P
K
 
N
A
 
A
K
 
V
L
 
L
L
 
G
E
 
Q
G
 
G
Y
 
Y
G
 
G
L
 
M
S
 
T
E
 
E
T
 
A
S
 
G
P
 
P
V
 
V
V
 
L
A
 
A
V
 
M
-
 
C
-
 
L
-
 
A
-
 
F
-
 
A
N
 
K
R
 
E
P
 
P
Y
 
F
L
 
E
Q
 
V
K
 
K
P
 
S
G
 
G
S
 
S
V
 
C
G
 
G
P
 
T
A
 
V
I
 
V
P
 
R
G
 
N
V
 
A
E
 
E
V
 
L
K
 
K
I
 
I
V
 
V
N
 
D
-
 
P
D
 
D
E
 
T
L
 
G
I
 
A
E
 
T
V
 
L
P
 
G
I
 
R
G
 
N
E
 
Q
A
 
S
G
|
G
E
 
E
I
 
I
I
 
C
V
 
I
K
 
R
G
 
G
D
 
E
I
 
Q
V
 
I
M
 
M
K
 
K
G
 
G
Y
 
Y
Y
 
L
N
 
N
R
 
D
D
 
P
E
 
E
A
 
S
N
 
T
E
 
K
E
 
N
C
 
T
L
 
I
I
 
D
-
 
K
N
 
G
G
 
G
W
 
W
F
 
L
L
 
H
T
 
T
G
 
G
D
 
D
I
 
I
G
 
G
K
 
Y
V
 
V
D
 
D
E
 
D
D
 
D
G
 
D
F
 
E
I
 
I
Y
 
F
I
 
I
L
 
V
D
 
D
R
 
R
K
 
L
K
 
K
D
 
E
L
 
I
I
 
I
I
 
K
S
 
Y
K
 
K
G
 
G
V
 
F
N
 
Q
I
 
V
Y
 
P
P
 
P
R
 
A
E
 
E
I
 
L
E
 
E
E
 
A
I
 
L
I
 
L
L
 
I
K
 
T
F
 
H
P
 
P
G
 
D
I
 
I
K
 
K
D
 
D
C
 
A
A
 
A
V
 
V
V
 
V
G
 
P
L
 
M
K
 
I
D
 
D
E
 
E
N
 
I
H
 
A
G
 
G
E
 
E
I
 
V
P
 
P
V
 
V
A
 
A
F
 
F
I
 
I
E
 
V
V
 
R
E
 
I
E
 
E
D
 
G
M
 
S
E
 
A
V
 
I
N
 
S
E
 
E
K
 
N
D
 
E
L
 
I
R
 
K
K
 
Q
Y
 
F
L
 
V
K
 
A
S
 
K
K
 
E
L
 
V
A
 
V
N
 
F
Y
 
Y
K
 
K
L
 
R
P
 
L
K
 
N
Y
 
K
I
 
V
Y
 
F
F
 
F
V
 
A
E
 
D
N
 
S
L
 
I
P
 
P
K
 
K
N
 
S
A
 
P
T
 
S
G
 
G
K
 
K
V
 
I
L
 
L
K
 
R
R
 
K
I
 
D
L
 
L
R
 
R
E
 
A
N
 
K
I
 
L

5busA O-succinylbenzoate coenzyme a synthetase (mene) from bacillus subtilis, in complex with amp (see paper)
30% identity, 96% coverage: 12:508/519 of query aligns to 7:475/481 of 5busA

query
sites
5busA
L
 
L
E
 
M
K
 
Q
N
 
R
A
 
A
K
 
Q
E
 
L
I
 
T
G
 
P
K
 
E
K
 
R
T
 
I
A
 
A
Y
 
L
F
 
I
I
 
Y
D
 
E
D
 
D
K
 
Q
K
 
T
I
 
V
S
 
T
W
 
F
Q
 
A
D
 
E
V
 
L
K
 
F
K
 
A
K
 
A
V
 
S
D
 
K
T
 
R
F
 
M
A
 
A
R
 
E
T
 
Q
L
 
L
E
 
A
L
 
A
L
 
H
G
 
S
I
 
V
K
 
R
K
 
K
G
 
G
D
 
D
K
 
T
I
 
A
P
 
A
I
 
I
Y
 
L
V
 
L
N
 
Q
N
 
N
S
 
R
L
 
A
E
 
E
F
 
M
V
 
V
I
 
Y
A
 
A
L
 
V
F
 
H
G
 
A
I
 
C
Q
 
F
K
 
L
I
 
L
G
 
G
A
 
V
V
 
K
P
 
A
V
 
V
P
 
L
I
 
L
N
 
N
T
 
T
F
 
K
L
 
L
K
 
S
E
 
T
D
 
H
E
 
E
I
 
R
S
 
L
F
 
F
I
 
Q
L
 
L
N
 
E
D
 
D
I
 
S
E
 
G
A
 
S
E
 
G
F
 
F
L
 
L
I
 
L
A
 
T
S
 
D
S
 
S
K
 
S
F
 
F
E
 
E
K
 
K
N
 
K
I
 
E
P
 
-
N
 
-
I
 
-
R
 
-
E
 
-
K
 
-
T
 
-
S
 
-
V
 
-
K
 
-
K
 
-
I
 
-
I
 
-
W
 
Y
E
 
E
G
 
H
E
 
I
P
 
V
S
 
Q
I
 
T
I
 
I
D
 
D
E
 
V
D
 
D
N
 
E
I
 
L
S
 
-
F
 
-
T
 
-
E
 
-
I
 
M
L
 
K
S
 
E
N
 
A
I
 
A
E
 
E
P
 
E
H
 
I
E
 
E
S
 
I
I
 
E
E
 
A
Y
 
Y
P
 
M
T
 
Q
L
 
M
D
 
D
D
 
A
L
 
T
A
 
A
V
 
T
I
 
L
I
 
M
Y
 
Y
T
|
T
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
K
P
 
P
K
 
K
G
 
G
A
 
V
M
 
Q
L
 
Q
T
 
T
Y
 
F
K
 
G
N
 
N
I
 
H
F
 
Y
A
 
F
D
x
S
I
 
A
W
 
V
G
 
S
I
 
S
N
 
A
E
 
L
I
 
N
V
 
L
K
 
G
I
 
I
T
 
T
P
 
E
K
 
Q
D
 
D
R
 
R
F
 
W
I
 
L
A
 
I
Y
 
A
L
 
L
P
 
P
M
 
L
F
 
F
H
|
H
S
 
I
F
 
S
T
 
G
M
 
L
T
 
S
V
 
A
N
 
L
I
 
F
L
 
K
L
 
S
P
 
V
L
 
I
Y
 
Y
T
 
-
G
 
-
S
 
G
A
 
M
V
 
T
V
 
V
I
 
V
I
 
L
K
 
H
S
 
Q
I
 
R
M
 
F
P
 
S
F
 
V
S
 
S
N
 
D
I
 
V
I
 
L
K
 
H
Q
 
S
T
 
I
L
 
N
L
 
R
K
 
H
R
 
E
V
 
V
T
 
T
I
 
M
F
 
I
T
 
S
G
 
A
V
 
V
P
 
Q
D
 
T
V
 
M
Y
 
L
S
 
A
A
 
S
L
 
L
-
 
L
-
 
E
S
 
E
R
 
T
A
 
N
K
 
R
L
 
C
P
 
P
F
 
-
Y
 
-
F
 
-
H
 
-
W
 
-
F
 
-
N
 
E
K
 
S
V
 
I
R
 
R
F
 
C
Y
 
I
V
 
L
S
 
L
G
 
G
A
x
G
A
x
G
A
 
P
L
 
A
P
 
P
G
 
L
E
 
P
V
 
L
L
 
L
E
 
E
R
 
E
F
 
C
S
 
R
K
 
E
K
 
K
F
 
-
K
 
-
K
 
G
A
 
F
K
 
P
L
 
V
L
 
F
E
 
Q
G
x
S
Y
 
Y
G
 
G
L
x
M
S
x
T
E
|
E
T
 
T
S
 
C
P
 
S
V
 
Q
V
 
I
A
 
V
V
 
T
N
 
L
R
 
S
P
 
P
-
 
E
-
 
F
Y
 
S
L
 
M
Q
 
E
K
 
K
P
 
L
G
 
G
S
 
S
V
 
A
G
 
G
P
 
K
A
 
P
I
 
L
P
 
F
G
 
S
V
 
C
E
 
E
V
 
I
K
 
K
I
 
I
V
 
E
N
 
R
D
 
D
E
 
G
L
 
Q
I
 
V
E
 
C
V
 
E
P
 
P
I
 
Y
G
 
-
E
 
E
A
 
H
G
 
G
E
 
E
I
 
I
I
 
M
V
 
V
K
 
K
G
 
G
D
 
P
I
 
N
V
 
V
M
 
M
K
 
K
G
 
S
Y
 
Y
Y
 
F
N
 
N
R
 
R
D
 
E
E
 
S
A
 
A
N
 
N
E
 
E
E
 
A
C
 
S
L
 
F
I
 
Q
N
 
N
G
 
G
W
 
W
F
 
L
L
 
K
T
 
T
G
 
G
D
|
D
I
 
L
G
 
G
K
 
Y
V
 
L
D
 
D
E
 
N
D
 
E
G
 
G
F
 
F
I
 
L
Y
 
Y
I
x
V
L
 
L
D
 
D
R
|
R
K
 
R
K
 
S
D
 
D
L
 
L
I
 
I
I
 
I
S
 
S
K
 
G
G
 
G
V
 
E
N
 
N
I
 
I
Y
 
Y
P
 
P
R
 
A
E
 
E
I
 
V
E
 
E
E
 
S
I
 
V
I
 
L
L
 
L
K
 
S
F
 
H
P
 
P
G
 
A
I
 
V
K
 
A
D
 
E
C
 
A
A
 
G
V
 
V
V
 
S
G
 
G
L
 
A
K
 
E
D
 
D
E
 
K
N
 
K
H
 
-
G
 
-
E
 
K
I
 
V
P
 
P
V
 
H
A
 
A
F
 
Y
I
 
L
E
 
V
V
 
L
E
 
H
E
 
K
D
 
P
M
 
V
E
 
S
V
 
A
N
 
G
E
 
E
K
 
-
D
 
-
L
 
L
R
 
T
K
 
D
Y
 
Y
L
 
C
K
 
K
S
 
E
K
 
R
L
 
L
A
 
A
N
 
K
Y
 
Y
K
 
K
L
 
I
P
 
P
K
 
A
Y
 
K
I
 
F
Y
 
F
F
 
V
V
 
L
E
 
D
N
 
R
L
 
L
P
 
P
K
 
R
N
 
N
A
 
A
T
 
S
G
 
N
K
|
K
V
 
L
L
 
L
K
 
R
R
 
N
I
 
Q
L
 
L
R
 
K
E
 
D

O24146 4-coumarate--CoA ligase 2; 4CL 2; Nt4CL-19; Nt4CL-2; 4-coumaroyl-CoA synthase 2; Caffeate--CoA ligase; Cinnamate--CoA ligase; Ferulate--CoA ligase; EC 6.2.1.12; EC 6.2.1.-; EC 6.2.1.-; EC 6.2.1.34 from Nicotiana tabacum (Common tobacco) (see paper)
32% identity, 93% coverage: 33:516/519 of query aligns to 54:542/542 of O24146

query
sites
O24146
S
 
T
W
 
Y
Q
 
A
D
 
D
V
 
V
K
 
E
K
 
L
K
 
N
V
 
S
D
 
R
T
 
K
F
 
V
A
 
A
R
 
A
T
 
G
L
 
L
E
 
H
L
 
K
L
 
Q
G
 
G
I
 
I
K
 
Q
K
 
P
G
 
K
D
 
D
K
 
T
I
 
I
P
 
M
I
 
I
Y
 
L
V
 
L
N
 
P
N
 
N
S
 
S
L
 
P
E
 
E
F
 
F
V
 
V
I
 
F
A
 
A
L
 
F
F
 
I
G
 
G
I
 
A
Q
 
S
K
 
Y
I
 
L
G
 
G
A
 
A
V
 
I
P
 
S
V
 
T
P
 
M
I
 
A
N
 
N
T
 
P
F
 
L
L
 
F
K
 
T
E
 
P
D
 
A
E
 
E
I
 
V
S
 
V
F
 
K
I
 
Q
L
 
A
N
 
K
D
 
A
I
 
S
E
 
S
A
 
A
E
 
K
F
 
I
L
 
I
I
 
V
A
 
T
S
 
Q
S
 
A
K
 
C
F
 
H
E
 
V
K
 
N
N
 
K
I
 
V
P
 
K
N
 
D
I
 
Y
R
 
A
E
 
F
K
 
E
T
 
N
S
 
D
V
 
V
K
 
K
K
 
I
I
 
I
I
 
C
W
 
I
E
 
D
G
 
S
E
 
A
P
 
P
S
 
-
I
 
-
I
 
-
D
 
-
E
 
E
D
 
G
N
 
C
I
 
L
S
 
H
F
 
F
T
 
S
E
 
-
I
 
V
L
 
L
S
 
T
N
 
Q
I
 
A
E
 
N
P
 
E
H
 
H
E
 
D
S
 
I
I
 
P
E
 
E
Y
 
V
P
 
E
T
 
I
L
 
Q
-
 
P
D
 
D
D
 
D
L
 
V
A
 
V
V
 
A
I
 
L
I
 
P
Y
 
Y
T
x
S
S
|
S
G
|
G
T
|
T
T
|
T
G
 
G
K
 
L
P
 
P
K
|
K
G
 
G
A
 
V
M
 
M
L
 
L
T
 
T
Y
 
H
K
 
K
N
 
G
I
 
L
F
 
V
A
 
T
D
 
S
I
 
V
W
 
A
-
 
Q
-
 
Q
-
 
V
-
 
D
G
 
G
I
 
E
N
 
N
E
 
P
I
 
N
V
 
L
K
 
Y
I
 
I
T
 
H
P
 
S
K
 
E
D
 
D
R
 
V
F
 
M
I
 
L
A
 
C
Y
 
V
L
 
L
P
 
P
M
 
L
F
 
F
H
|
H
S
 
I
F
x
Y
T
 
S
M
 
L
T
 
N
V
x
S
N
 
V
I
 
L
L
 
L
L
 
C
P
 
G
L
 
L
Y
 
R
T
 
V
G
 
G
S
 
A
A
 
A
V
 
I
V
 
L
I
 
I
I
 
M
K
 
Q
-
x
K
-
 
F
S
 
D
I
 
I
M
 
V
P
 
S
F
 
F
S
 
L
N
 
E
I
 
L
I
 
I
K
 
Q
Q
 
R
T
 
Y
L
 
-
L
 
-
K
 
-
R
 
K
V
 
V
T
 
T
I
 
I
F
 
G
T
 
P
G
 
F
V
 
V
P
 
P
D
 
P
V
 
I
Y
 
V
S
 
L
A
 
A
L
 
I
S
 
-
R
 
-
A
 
A
K
 
K
L
 
S
P
 
P
F
 
M
Y
 
V
F
 
D
H
 
D
W
 
Y
-
 
D
F
 
L
N
 
S
K
 
S
V
 
V
R
 
R
F
 
T
Y
 
V
V
 
M
S
 
S
G
 
G
A
|
A
A
 
A
A
 
P
L
 
L
P
 
G
G
 
K
E
 
E
V
 
L
L
 
E
E
 
D
R
 
T
F
 
V
S
 
R
K
 
A
K
 
K
F
 
F
K
 
P
K
 
N
A
 
A
K
 
K
L
 
L
L
 
G
E
x
Q
G
|
G
Y
 
Y
G
 
G
L
 
M
S
x
T
E
 
E
T
 
A
S
 
G
P
 
P
V
|
V
V
 
L
A
 
A
V
x
M
N
 
C
R
 
L
P
 
A
Y
 
F
L
 
A
Q
 
K
K
 
E
P
 
P
-
 
F
-
 
E
-
 
I
-
 
K
-
 
S
G
 
G
S
 
A
V
 
C
G
 
G
P
 
T
A
 
V
I
 
V
P
 
R
G
 
N
V
 
A
E
 
E
V
 
M
K
 
K
I
 
I
V
 
V
N
 
D
D
 
P
E
 
K
L
 
T
-
 
G
I
 
N
E
 
S
V
 
L
P
 
P
I
 
R
G
 
N
E
 
Q
A
 
S
G
 
G
E
 
E
I
 
I
I
 
C
V
 
I
K
 
R
G
 
G
D
 
D
I
 
Q
V
 
I
M
 
M
K
 
K
G
 
G
Y
 
Y
Y
 
L
N
 
N
R
 
D
D
 
P
E
 
E
A
 
A
N
 
T
E
 
A
E
 
R
C
 
T
L
 
I
-
 
D
I
 
K
N
 
E
G
 
G
W
 
W
F
 
L
L
 
Y
T
 
T
G
 
G
D
|
D
I
 
I
G
 
G
K
 
Y
V
 
I
D
 
D
E
 
D
D
 
D
G
 
D
F
 
E
I
 
L
Y
 
F
I
 
I
L
 
V
D
 
D
R
|
R
K
 
L
K
|
K
D
 
E
L
 
L
I
 
I
I
x
K
S
 
Y
K
|
K
G
|
G
V
 
F
N
x
Q
I
 
V
Y
 
A
P
 
P
R
 
A
E
 
E
I
 
L
E
 
E
E
 
A
I
 
L
I
 
L
L
 
L
K
 
N
F
 
H
P
 
P
G
 
N
I
 
I
K
 
S
D
 
D
C
 
A
A
 
A
V
 
V
V
 
V
G
 
P
L
 
M
K
 
K
D
 
D
E
 
E
N
 
Q
H
 
A
G
 
G
E
 
E
I
 
V
P
 
P
V
 
V
A
 
A
F
 
F
I
 
V
E
 
V
V
 
R
E
 
S
E
 
N
D
 
G
M
 
S
E
 
T
V
 
I
N
 
T
E
 
E
K
 
D
D
 
E
L
 
V
R
 
K
K
 
D
Y
 
F
L
 
I
K
 
S
S
 
K
K
 
Q
L
 
V
A
 
I
N
 
F
Y
 
Y
K
 
K
L
 
R
P
 
I
K
 
K
Y
 
R
I
 
V
Y
 
F
F
 
F
V
 
V
E
 
D
N
 
A
L
 
I
P
 
P
K
 
K
N
 
S
A
 
P
T
 
S
G
 
G
K
|
K
V
 
I
L
 
L
K
 
R
R
 
K
I
 
D
L
 
L
R
 
R
E
 
A
N
 
K
I
 
L
D
 
A
K
 
A
Y
 
G
I
 
L
S
 
P
N
 
N

5bsvA Crystal structure of 4-coumarate:coa ligase complexed with feruloyl adenylate (see paper)
32% identity, 92% coverage: 33:510/519 of query aligns to 47:529/529 of 5bsvA

query
sites
5bsvA
S
 
T
W
 
Y
Q
 
A
D
 
D
V
 
V
K
 
E
K
 
L
K
 
N
V
 
S
D
 
R
T
 
K
F
 
V
A
 
A
R
 
A
T
 
G
L
 
L
E
 
H
L
 
K
L
 
Q
G
 
G
I
 
I
K
 
Q
K
 
P
G
 
K
D
 
D
K
 
T
I
 
I
P
 
M
I
 
I
Y
 
L
V
 
L
N
 
P
N
 
N
S
 
S
L
 
P
E
 
E
F
 
F
V
 
V
I
 
F
A
 
A
L
 
F
F
 
I
G
 
G
I
 
A
Q
 
S
K
 
Y
I
 
L
G
 
G
A
 
A
V
 
I
P
 
S
V
 
T
P
 
M
I
 
A
N
 
N
T
 
P
F
 
L
L
 
F
K
 
T
E
 
P
D
 
A
E
 
E
I
 
V
S
 
V
F
 
K
I
 
Q
L
 
A
N
 
K
D
 
A
I
 
S
E
 
S
A
 
A
E
 
K
F
 
I
L
 
I
I
 
V
A
 
T
S
 
Q
S
 
A
K
 
C
F
 
H
E
 
V
K
 
N
N
 
K
I
 
V
P
 
K
N
 
D
I
 
Y
R
 
A
E
 
F
K
 
E
T
 
N
S
 
D
V
 
V
K
 
K
K
 
I
I
 
I
I
 
C
W
 
I
E
 
D
G
 
S
E
 
A
P
 
P
S
 
-
I
 
-
I
 
-
D
 
-
E
 
E
D
 
G
N
 
C
I
 
L
S
 
H
F
 
F
T
 
S
E
 
-
I
 
V
L
 
L
S
 
T
N
 
Q
I
 
A
E
 
N
P
 
E
H
 
H
E
 
D
S
 
I
I
 
P
E
 
E
Y
 
V
P
 
E
T
 
I
L
 
Q
-
 
P
D
 
D
D
 
D
L
 
V
A
 
V
V
 
A
I
 
L
I
 
P
Y
 
Y
T
x
S
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
L
P
 
P
K
 
K
G
 
G
A
 
V
M
 
M
L
 
L
T
 
T
Y
 
H
K
 
K
N
 
G
I
 
L
F
 
V
A
 
T
D
x
S
I
 
V
W
 
A
-
 
Q
-
 
Q
-
 
V
-
 
D
G
 
G
I
 
E
N
 
N
E
 
P
I
 
N
V
 
L
K
 
Y
I
 
I
T
 
H
P
 
S
K
 
E
D
 
D
R
 
V
F
 
M
I
 
L
A
 
C
Y
 
V
L
 
L
P
 
P
M
 
L
F
 
F
H
|
H
S
 
I
F
x
Y
T
 
S
M
 
L
T
 
N
V
x
S
N
 
V
I
 
L
L
 
L
L
 
C
P
 
G
L
 
L
Y
 
R
T
 
V
G
 
G
S
 
A
A
 
A
V
 
I
V
 
L
I
 
I
I
 
M
K
 
Q
-
 
K
-
 
F
S
 
D
I
 
I
M
 
V
P
 
S
F
 
F
S
 
L
N
 
E
I
 
L
I
 
I
K
 
Q
Q
 
R
T
 
Y
L
 
-
L
 
-
K
 
-
R
 
K
V
 
V
T
 
T
I
 
I
F
 
G
T
 
P
G
 
F
V
 
V
P
 
P
D
 
P
V
 
I
Y
 
V
S
 
L
A
 
A
L
 
I
S
 
-
R
 
-
A
 
A
K
 
K
L
 
S
P
 
P
F
 
M
Y
 
V
F
 
D
H
 
D
W
 
Y
-
 
D
F
 
L
N
 
S
K
 
S
V
 
V
R
 
R
F
 
T
Y
 
V
V
 
M
S
 
S
G
 
G
A
|
A
A
|
A
A
x
P
L
 
L
P
 
G
G
 
K
E
 
E
V
 
L
L
 
E
E
 
D
R
 
T
F
 
V
S
 
R
K
 
A
K
 
K
F
 
F
K
 
P
K
 
N
A
 
A
K
 
K
L
 
L
L
 
G
E
 
Q
G
|
G
Y
 
Y
G
|
G
L
x
M
S
x
T
E
|
E
T
 
A
S
 
G
P
|
P
V
|
V
V
 
L
A
 
A
V
 
M
N
 
C
R
 
L
P
 
A
Y
 
F
L
 
A
Q
 
K
K
 
E
P
 
P
-
 
F
-
 
E
-
 
I
-
 
K
-
 
S
G
 
G
S
 
A
V
 
C
G
 
G
P
 
T
A
 
V
I
 
V
P
 
R
G
 
N
V
 
A
E
 
E
V
 
M
K
 
K
I
 
I
V
 
V
N
 
D
D
 
P
E
 
K
L
 
T
-
 
G
I
 
N
E
 
S
V
 
L
P
 
P
I
 
R
G
 
N
E
 
Q
A
 
S
G
 
G
E
 
E
I
 
I
I
 
C
V
 
I
K
 
R
G
 
G
D
 
D
I
 
Q
V
 
I
M
 
M
K
 
K
G
 
G
Y
 
Y
Y
 
L
N
 
N
R
 
D
D
 
P
E
 
E
A
 
A
N
 
T
E
 
A
E
 
R
C
 
T
L
 
I
-
 
D
I
 
K
N
 
E
G
 
G
W
 
W
F
 
L
L
 
Y
T
 
T
G
 
G
D
|
D
I
 
I
G
 
G
K
 
Y
V
 
I
D
 
D
E
 
D
D
 
D
G
 
D
F
 
E
I
 
L
Y
 
F
I
 
I
L
 
V
D
 
D
R
 
R
K
 
L
K
|
K
D
 
E
L
 
L
I
 
I
I
x
K
S
 
Y
K
 
K
G
 
G
V
 
F
N
x
Q
I
 
V
Y
 
A
P
 
P
R
 
A
E
 
E
I
 
L
E
 
E
E
 
A
I
 
L
I
 
L
L
 
L
K
 
N
F
 
H
P
 
P
G
 
N
I
 
I
K
 
S
D
 
D
C
 
A
A
 
A
V
 
V
V
 
V
G
 
P
L
 
M
K
 
K
D
 
D
E
 
E
N
 
Q
H
 
A
G
 
G
E
 
E
I
 
V
P
 
P
V
 
V
A
 
A
F
 
F
I
 
V
E
 
V
V
 
R
E
 
S
E
 
N
D
 
G
M
 
S
E
 
T
V
 
I
N
 
T
E
 
E
K
 
D
D
 
E
L
 
V
R
 
K
K
 
D
Y
 
F
L
 
I
K
 
S
S
 
K
K
 
Q
L
 
V
A
 
I
N
 
F
Y
 
Y
K
 
K
L
 
R
P
 
I
K
 
K
Y
 
R
I
 
V
Y
 
F
F
 
F
V
 
V
E
 
D
N
 
A
L
 
I
P
 
P
K
 
K
N
 
S
A
 
P
T
 
S
G
 
G
K
|
K
V
 
I
L
 
L
K
 
R
R
 
K
I
 
D
L
 
L
R
 
R
E
 
A
N
 
K
I
 
L

5bsuA Crystal structure of 4-coumarate:coa ligase complexed with caffeoyl adenylate (see paper)
32% identity, 92% coverage: 33:510/519 of query aligns to 47:529/529 of 5bsuA

query
sites
5bsuA
S
 
T
W
 
Y
Q
 
A
D
 
D
V
 
V
K
 
E
K
 
L
K
 
N
V
 
S
D
 
R
T
 
K
F
 
V
A
 
A
R
 
A
T
 
G
L
 
L
E
 
H
L
 
K
L
 
Q
G
 
G
I
 
I
K
 
Q
K
 
P
G
 
K
D
 
D
K
 
T
I
 
I
P
 
M
I
 
I
Y
 
L
V
 
L
N
 
P
N
 
N
S
 
S
L
 
P
E
 
E
F
 
F
V
 
V
I
 
F
A
 
A
L
 
F
F
 
I
G
 
G
I
 
A
Q
 
S
K
 
Y
I
 
L
G
 
G
A
 
A
V
 
I
P
 
S
V
 
T
P
 
M
I
 
A
N
 
N
T
 
P
F
 
L
L
 
F
K
 
T
E
 
P
D
 
A
E
 
E
I
 
V
S
 
V
F
 
K
I
 
Q
L
 
A
N
 
K
D
 
A
I
 
S
E
 
S
A
 
A
E
 
K
F
 
I
L
 
I
I
 
V
A
 
T
S
 
Q
S
 
A
K
 
C
F
 
H
E
 
V
K
 
N
N
 
K
I
 
V
P
 
K
N
 
D
I
 
Y
R
 
A
E
 
F
K
 
E
T
 
N
S
 
D
V
 
V
K
 
K
K
 
I
I
 
I
I
 
C
W
 
I
E
 
D
G
 
S
E
 
A
P
 
P
S
 
-
I
 
-
I
 
-
D
 
-
E
 
E
D
 
G
N
 
C
I
 
L
S
 
H
F
 
F
T
 
S
E
 
-
I
 
V
L
 
L
S
 
T
N
 
Q
I
 
A
E
 
N
P
 
E
H
 
H
E
 
D
S
 
I
I
 
P
E
 
E
Y
 
V
P
 
E
T
 
I
L
 
Q
-
 
P
D
 
D
D
 
D
L
 
V
A
 
V
V
 
A
I
 
L
I
 
P
Y
 
Y
T
x
S
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
L
P
 
P
K
 
K
G
 
G
A
 
V
M
 
M
L
 
L
T
 
T
Y
 
H
K
 
K
N
 
G
I
 
L
F
 
V
A
 
T
D
x
S
I
 
V
W
 
A
-
 
Q
-
 
Q
-
 
V
-
 
D
G
 
G
I
 
E
N
 
N
E
 
P
I
 
N
V
 
L
K
 
Y
I
 
I
T
 
H
P
 
S
K
 
E
D
 
D
R
 
V
F
 
M
I
 
L
A
 
C
Y
 
V
L
 
L
P
 
P
M
 
L
F
 
F
H
|
H
S
 
I
F
x
Y
T
 
S
M
 
L
T
 
N
V
x
S
N
 
V
I
 
L
L
 
L
L
 
C
P
 
G
L
 
L
Y
 
R
T
 
V
G
 
G
S
 
A
A
 
A
V
 
I
V
 
L
I
 
I
I
 
M
K
 
Q
-
 
K
-
 
F
S
 
D
I
 
I
M
 
V
P
 
S
F
 
F
S
 
L
N
 
E
I
 
L
I
 
I
K
 
Q
Q
 
R
T
 
Y
L
 
-
L
 
-
K
 
-
R
 
K
V
 
V
T
 
T
I
 
I
F
 
G
T
 
P
G
 
F
V
 
V
P
 
P
D
 
P
V
 
I
Y
 
V
S
 
L
A
 
A
L
 
I
S
 
-
R
 
-
A
 
A
K
 
K
L
 
S
P
 
P
F
 
M
Y
 
V
F
 
D
H
 
D
W
 
Y
-
 
D
F
 
L
N
 
S
K
 
S
V
 
V
R
 
R
F
 
T
Y
 
V
V
x
M
S
 
S
G
 
G
A
|
A
A
|
A
A
x
P
L
 
L
P
 
G
G
 
K
E
 
E
V
 
L
L
 
E
E
 
D
R
 
T
F
 
V
S
 
R
K
 
A
K
 
K
F
 
F
K
 
P
K
 
N
A
 
A
K
 
K
L
 
L
L
 
G
E
 
Q
G
|
G
Y
 
Y
G
|
G
L
x
M
S
x
T
E
|
E
T
 
A
S
 
G
P
|
P
V
 
V
V
 
L
A
 
A
V
 
M
N
 
C
R
 
L
P
 
A
Y
 
F
L
 
A
Q
 
K
K
 
E
P
 
P
-
 
F
-
 
E
-
 
I
-
 
K
-
 
S
G
 
G
S
 
A
V
 
C
G
 
G
P
 
T
A
 
V
I
 
V
P
 
R
G
 
N
V
 
A
E
 
E
V
 
M
K
 
K
I
 
I
V
 
V
N
 
D
D
 
P
E
 
K
L
 
T
-
 
G
I
 
N
E
 
S
V
 
L
P
 
P
I
 
R
G
 
N
E
 
Q
A
 
S
G
 
G
E
 
E
I
 
I
I
 
C
V
 
I
K
 
R
G
 
G
D
 
D
I
 
Q
V
 
I
M
 
M
K
 
K
G
 
G
Y
 
Y
Y
 
L
N
 
N
R
 
D
D
 
P
E
 
E
A
 
A
N
 
T
E
 
A
E
 
R
C
 
T
L
 
I
-
 
D
I
 
K
N
 
E
G
 
G
W
 
W
F
 
L
L
 
Y
T
 
T
G
 
G
D
|
D
I
 
I
G
 
G
K
 
Y
V
 
I
D
 
D
E
 
D
D
 
D
G
 
D
F
 
E
I
 
L
Y
 
F
I
 
I
L
 
V
D
 
D
R
 
R
K
 
L
K
|
K
D
 
E
L
 
L
I
 
I
I
x
K
S
 
Y
K
 
K
G
 
G
V
 
F
N
x
Q
I
 
V
Y
 
A
P
 
P
R
 
A
E
 
E
I
 
L
E
 
E
E
 
A
I
 
L
I
 
L
L
 
L
K
 
N
F
 
H
P
 
P
G
 
N
I
 
I
K
 
S
D
 
D
C
 
A
A
 
A
V
 
V
V
 
V
G
 
P
L
 
M
K
 
K
D
 
D
E
 
E
N
 
Q
H
 
A
G
 
G
E
 
E
I
 
V
P
 
P
V
 
V
A
 
A
F
 
F
I
 
V
E
 
V
V
 
R
E
 
S
E
 
N
D
 
G
M
 
S
E
 
T
V
 
I
N
 
T
E
 
E
K
 
D
D
 
E
L
 
V
R
 
K
K
 
D
Y
 
F
L
 
I
K
 
S
S
 
K
K
 
Q
L
 
V
A
 
I
N
 
F
Y
 
Y
K
 
K
L
 
R
P
 
I
K
 
K
Y
 
R
I
 
V
Y
 
F
F
 
F
V
 
V
E
 
D
N
 
A
L
 
I
P
 
P
K
 
K
N
 
S
A
 
P
T
 
S
G
 
G
K
|
K
V
 
I
L
 
L
K
 
R
R
 
K
I
 
D
L
 
L
R
 
R
E
 
A
N
 
K
I
 
L

5bstA Crystal structure of 4-coumarate:coa ligase complexed with coumaroyl adenylate (see paper)
32% identity, 92% coverage: 33:510/519 of query aligns to 47:529/529 of 5bstA

query
sites
5bstA
S
 
T
W
 
Y
Q
 
A
D
 
D
V
 
V
K
 
E
K
 
L
K
 
N
V
 
S
D
 
R
T
 
K
F
 
V
A
 
A
R
 
A
T
 
G
L
 
L
E
 
H
L
 
K
L
 
Q
G
 
G
I
 
I
K
 
Q
K
 
P
G
 
K
D
 
D
K
 
T
I
 
I
P
 
M
I
 
I
Y
 
L
V
 
L
N
 
P
N
 
N
S
 
S
L
 
P
E
 
E
F
 
F
V
 
V
I
 
F
A
 
A
L
 
F
F
 
I
G
 
G
I
 
A
Q
 
S
K
 
Y
I
 
L
G
 
G
A
 
A
V
 
I
P
 
S
V
 
T
P
 
M
I
 
A
N
 
N
T
 
P
F
 
L
L
 
F
K
 
T
E
 
P
D
 
A
E
 
E
I
 
V
S
 
V
F
 
K
I
 
Q
L
 
A
N
 
K
D
 
A
I
 
S
E
 
S
A
 
A
E
 
K
F
 
I
L
 
I
I
 
V
A
 
T
S
 
Q
S
 
A
K
 
C
F
 
H
E
 
V
K
 
N
N
 
K
I
 
V
P
 
K
N
 
D
I
 
Y
R
 
A
E
 
F
K
 
E
T
 
N
S
 
D
V
 
V
K
 
K
K
 
I
I
 
I
I
 
C
W
 
I
E
 
D
G
 
S
E
 
A
P
 
P
S
 
-
I
 
-
I
 
-
D
 
-
E
 
E
D
 
G
N
 
C
I
 
L
S
 
H
F
 
F
T
 
S
E
 
-
I
 
V
L
 
L
S
 
T
N
 
Q
I
 
A
E
 
N
P
 
E
H
 
H
E
 
D
S
 
I
I
 
P
E
 
E
Y
 
V
P
 
E
T
 
I
L
 
Q
-
 
P
D
 
D
D
 
D
L
 
V
A
 
V
V
 
A
I
 
L
I
 
P
Y
 
Y
T
x
S
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
L
P
 
P
K
 
K
G
 
G
A
 
V
M
 
M
L
 
L
T
 
T
Y
 
H
K
 
K
N
 
G
I
 
L
F
 
V
A
 
T
D
x
S
I
 
V
W
 
A
-
 
Q
-
 
Q
-
 
V
-
 
D
G
 
G
I
 
E
N
 
N
E
 
P
I
 
N
V
 
L
K
 
Y
I
 
I
T
 
H
P
 
S
K
 
E
D
 
D
R
 
V
F
 
M
I
 
L
A
 
C
Y
 
V
L
 
L
P
 
P
M
 
L
F
 
F
H
|
H
S
 
I
F
x
Y
T
 
S
M
 
L
T
 
N
V
x
S
N
 
V
I
 
L
L
 
L
L
 
C
P
 
G
L
 
L
Y
 
R
T
 
V
G
 
G
S
 
A
A
 
A
V
 
I
V
 
L
I
 
I
I
 
M
K
 
Q
-
 
K
-
 
F
S
 
D
I
 
I
M
 
V
P
 
S
F
 
F
S
 
L
N
 
E
I
 
L
I
 
I
K
 
Q
Q
 
R
T
 
Y
L
 
-
L
 
-
K
 
-
R
 
K
V
 
V
T
 
T
I
 
I
F
 
G
T
 
P
G
 
F
V
 
V
P
 
P
D
 
P
V
 
I
Y
 
V
S
 
L
A
 
A
L
 
I
S
 
-
R
 
-
A
 
A
K
 
K
L
 
S
P
 
P
F
 
M
Y
 
V
F
 
D
H
 
D
W
 
Y
-
 
D
F
 
L
N
 
S
K
 
S
V
 
V
R
 
R
F
 
T
Y
 
V
V
 
M
S
 
S
G
 
G
A
|
A
A
|
A
A
x
P
L
 
L
P
 
G
G
 
K
E
 
E
V
 
L
L
 
E
E
 
D
R
 
T
F
 
V
S
 
R
K
 
A
K
 
K
F
 
F
K
 
P
K
 
N
A
 
A
K
 
K
L
 
L
L
 
G
E
 
Q
G
|
G
Y
|
Y
G
|
G
L
x
M
S
x
T
E
|
E
T
 
A
S
 
G
P
|
P
V
|
V
V
 
L
A
 
A
V
 
M
N
 
C
R
 
L
P
 
A
Y
 
F
L
 
A
Q
 
K
K
 
E
P
 
P
-
 
F
-
 
E
-
 
I
-
 
K
-
 
S
G
 
G
S
 
A
V
 
C
G
 
G
P
 
T
A
 
V
I
 
V
P
 
R
G
 
N
V
 
A
E
 
E
V
 
M
K
 
K
I
 
I
V
 
V
N
 
D
D
 
P
E
 
K
L
 
T
-
 
G
I
 
N
E
 
S
V
 
L
P
 
P
I
 
R
G
 
N
E
 
Q
A
 
S
G
 
G
E
 
E
I
 
I
I
 
C
V
 
I
K
 
R
G
 
G
D
 
D
I
 
Q
V
 
I
M
 
M
K
 
K
G
 
G
Y
 
Y
Y
 
L
N
 
N
R
 
D
D
 
P
E
 
E
A
 
A
N
 
T
E
 
A
E
 
R
C
 
T
L
 
I
-
 
D
I
 
K
N
 
E
G
 
G
W
 
W
F
 
L
L
 
Y
T
 
T
G
 
G
D
|
D
I
 
I
G
 
G
K
 
Y
V
 
I
D
 
D
E
 
D
D
 
D
G
 
D
F
 
E
I
 
L
Y
 
F
I
 
I
L
 
V
D
 
D
R
 
R
K
 
L
K
|
K
D
 
E
L
 
L
I
 
I
I
x
K
S
 
Y
K
 
K
G
 
G
V
 
F
N
x
Q
I
 
V
Y
 
A
P
 
P
R
 
A
E
 
E
I
 
L
E
 
E
E
 
A
I
 
L
I
 
L
L
 
L
K
 
N
F
 
H
P
 
P
G
 
N
I
 
I
K
 
S
D
 
D
C
 
A
A
 
A
V
 
V
V
 
V
G
 
P
L
 
M
K
 
K
D
 
D
E
 
E
N
 
Q
H
 
A
G
 
G
E
 
E
I
 
V
P
 
P
V
 
V
A
 
A
F
 
F
I
 
V
E
 
V
V
 
R
E
 
S
E
 
N
D
 
G
M
 
S
E
 
T
V
 
I
N
 
T
E
 
E
K
 
D
D
 
E
L
 
V
R
 
K
K
 
D
Y
 
F
L
 
I
K
 
S
S
 
K
K
 
Q
L
 
V
A
 
I
N
 
F
Y
 
Y
K
 
K
L
 
R
P
 
I
K
 
K
Y
 
R
I
 
V
Y
 
F
F
 
F
V
 
V
E
 
D
N
 
A
L
 
I
P
 
P
K
 
K
N
 
S
A
 
P
T
 
S
G
 
G
K
|
K
V
 
I
L
 
L
K
 
R
R
 
K
I
 
D
L
 
L
R
 
R
E
 
A
N
 
K
I
 
L

5bsmA Crystal structure of 4-coumarate:coa ligase complexed with magnesium and adenosine triphosphate (see paper)
32% identity, 92% coverage: 33:510/519 of query aligns to 47:529/530 of 5bsmA

query
sites
5bsmA
S
 
T
W
 
Y
Q
 
A
D
 
D
V
 
V
K
 
E
K
 
L
K
 
N
V
 
S
D
 
R
T
 
K
F
 
V
A
 
A
R
 
A
T
 
G
L
 
L
E
 
H
L
 
K
L
 
Q
G
 
G
I
 
I
K
 
Q
K
 
P
G
 
K
D
 
D
K
 
T
I
 
I
P
 
M
I
 
I
Y
 
L
V
 
L
N
 
P
N
 
N
S
 
S
L
 
P
E
 
E
F
 
F
V
 
V
I
 
F
A
 
A
L
 
F
F
 
I
G
 
G
I
 
A
Q
 
S
K
 
Y
I
 
L
G
 
G
A
 
A
V
 
I
P
 
S
V
 
T
P
 
M
I
 
A
N
 
N
T
 
P
F
 
L
L
 
F
K
 
T
E
 
P
D
 
A
E
 
E
I
 
V
S
 
V
F
 
K
I
 
Q
L
 
A
N
 
K
D
 
A
I
 
S
E
 
S
A
 
A
E
 
K
F
 
I
L
 
I
I
 
V
A
 
T
S
 
Q
S
 
A
K
 
C
F
 
H
E
 
V
K
 
N
N
 
K
I
 
V
P
 
K
N
 
D
I
 
Y
R
 
A
E
 
F
K
 
E
T
 
N
S
 
D
V
 
V
K
 
K
K
 
I
I
 
I
I
 
C
W
 
I
E
 
D
G
 
S
E
 
A
P
 
P
S
 
-
I
 
-
I
 
-
D
 
-
E
 
E
D
 
G
N
 
C
I
 
L
S
 
H
F
 
F
T
 
S
E
 
-
I
 
V
L
 
L
S
 
T
N
 
Q
I
 
A
E
 
N
P
 
E
H
 
H
E
 
D
S
 
I
I
 
P
E
 
E
Y
 
V
P
 
E
T
 
I
L
 
Q
-
 
P
D
 
D
D
 
D
L
 
V
A
 
V
V
 
A
I
 
L
I
 
P
Y
 
Y
T
x
S
S
|
S
G
|
G
T
|
T
T
|
T
G
 
G
K
 
L
P
 
P
K
|
K
G
 
G
A
 
V
M
 
M
L
 
L
T
 
T
Y
 
H
K
 
K
N
 
G
I
 
L
F
 
V
A
 
T
D
x
S
I
 
V
W
 
A
-
 
Q
-
 
Q
-
 
V
-
 
D
G
 
G
I
 
E
N
 
N
E
 
P
I
 
N
V
 
L
K
 
Y
I
 
I
T
 
H
P
 
S
K
 
E
D
 
D
R
 
V
F
 
M
I
 
L
A
 
C
Y
 
V
L
 
L
P
 
P
M
 
L
F
 
F
H
|
H
S
 
I
F
 
Y
T
 
S
M
 
L
T
 
N
V
 
S
N
 
V
I
 
L
L
 
L
L
 
C
P
 
G
L
 
L
Y
 
R
T
 
V
G
 
G
S
 
A
A
 
A
V
 
I
V
 
L
I
 
I
I
 
M
K
 
Q
-
 
K
-
 
F
S
 
D
I
 
I
M
 
V
P
 
S
F
 
F
S
 
L
N
 
E
I
 
L
I
 
I
K
 
Q
Q
 
R
T
 
Y
L
 
-
L
 
-
K
 
-
R
 
K
V
 
V
T
 
T
I
 
I
F
 
G
T
 
P
G
 
F
V
 
V
P
 
P
D
 
P
V
 
I
Y
 
V
S
 
L
A
 
A
L
 
I
S
 
-
R
 
-
A
 
A
K
 
K
L
 
S
P
 
P
F
 
M
Y
 
V
F
 
D
H
 
D
W
 
Y
-
 
D
F
 
L
N
 
S
K
 
S
V
 
V
R
 
R
F
 
T
Y
 
V
V
 
M
S
 
S
G
 
G
A
|
A
A
|
A
A
x
P
L
 
L
P
 
G
G
 
K
E
 
E
V
 
L
L
 
E
E
 
D
R
 
T
F
 
V
S
 
R
K
 
A
K
 
K
F
 
F
K
 
P
K
 
N
A
 
A
K
 
K
L
 
L
L
 
G
E
 
Q
G
 
G
Y
|
Y
G
|
G
L
x
M
S
x
T
E
|
E
T
 
A
S
 
G
P
 
P
V
 
V
V
 
L
A
 
A
V
 
M
N
 
C
R
 
L
P
 
A
Y
 
F
L
 
A
Q
 
K
K
 
E
P
 
P
-
 
F
-
 
E
-
 
I
-
 
K
-
 
S
G
 
G
S
 
A
V
 
C
G
 
G
P
 
T
A
 
V
I
 
V
P
 
R
G
 
N
V
 
A
E
 
E
V
 
M
K
 
K
I
 
I
V
 
V
N
 
D
D
 
P
E
 
K
L
 
T
-
 
G
I
 
N
E
 
S
V
 
L
P
 
P
I
 
R
G
 
N
E
 
Q
A
 
S
G
 
G
E
 
E
I
 
I
I
 
C
V
 
I
K
 
R
G
 
G
D
 
D
I
 
Q
V
 
I
M
 
M
K
 
K
G
 
G
Y
 
Y
Y
 
L
N
 
N
R
 
D
D
 
P
E
 
E
A
 
A
N
 
T
E
 
A
E
 
R
C
 
T
L
 
I
-
 
D
I
 
K
N
 
E
G
 
G
W
 
W
F
 
L
L
 
Y
T
 
T
G
 
G
D
|
D
I
 
I
G
 
G
K
 
Y
V
 
I
D
 
D
E
 
D
D
 
D
G
 
D
F
 
E
I
 
L
Y
 
F
I
|
I
L
 
V
D
 
D
R
|
R
K
 
L
K
 
K
D
 
E
L
 
L
I
 
I
I
x
K
S
 
Y
K
 
K
G
 
G
V
 
F
N
x
Q
I
 
V
Y
 
A
P
 
P
R
 
A
E
 
E
I
 
L
E
 
E
E
 
A
I
 
L
I
 
L
L
 
L
K
 
N
F
 
H
P
 
P
G
 
N
I
 
I
K
 
S
D
 
D
C
 
A
A
 
A
V
 
V
V
 
V
G
 
P
L
 
M
K
 
K
D
 
D
E
 
E
N
 
Q
H
 
A
G
 
G
E
 
E
I
 
V
P
 
P
V
 
V
A
 
A
F
 
F
I
 
V
E
 
V
V
 
R
E
 
S
E
 
N
D
 
G
M
 
S
E
 
T
V
 
I
N
 
T
E
 
E
K
 
D
D
 
E
L
 
V
R
 
K
K
 
D
Y
 
F
L
 
I
K
 
S
S
 
K
K
 
Q
L
 
V
A
 
I
N
 
F
Y
 
Y
K
 
K
L
 
R
P
 
I
K
 
K
Y
 
R
I
 
V
Y
 
F
F
 
F
V
 
V
E
 
D
N
 
A
L
 
I
P
 
P
K
 
K
N
 
S
A
 
P
T
 
S
G
 
G
K
|
K
V
 
I
L
 
L
K
 
R
R
 
K
I
 
D
L
 
L
R
 
R
E
 
A
N
 
K
I
 
L

5bsrA Crystal structure of 4-coumarate:coa ligase complexed with adenosine monophosphate and coenzyme a (see paper)
32% identity, 92% coverage: 33:510/519 of query aligns to 46:528/528 of 5bsrA

query
sites
5bsrA
S
 
T
W
 
Y
Q
 
A
D
 
D
V
 
V
K
 
E
K
 
L
K
 
N
V
 
S
D
 
R
T
 
K
F
 
V
A
 
A
R
 
A
T
 
G
L
 
L
E
 
H
L
 
K
L
 
Q
G
 
G
I
 
I
K
 
Q
K
 
P
G
 
K
D
 
D
K
 
T
I
 
I
P
 
M
I
 
I
Y
 
L
V
 
L
N
 
P
N
 
N
S
 
S
L
 
P
E
 
E
F
 
F
V
 
V
I
 
F
A
 
A
L
 
F
F
 
I
G
 
G
I
 
A
Q
 
S
K
 
Y
I
 
L
G
 
G
A
 
A
V
 
I
P
 
S
V
 
T
P
 
M
I
 
A
N
 
N
T
 
P
F
x
L
L
 
F
K
 
T
E
 
P
D
 
A
E
 
E
I
 
V
S
 
V
F
 
K
I
 
Q
L
 
A
N
 
K
D
 
A
I
 
S
E
 
S
A
 
A
E
 
K
F
 
I
L
 
I
I
 
V
A
 
T
S
 
Q
S
 
A
K
 
C
F
 
H
E
 
V
K
 
N
N
 
K
I
 
V
P
 
K
N
 
D
I
 
Y
R
 
A
E
 
F
K
 
E
T
 
N
S
 
D
V
 
V
K
 
K
K
 
I
I
 
I
I
 
C
W
 
I
E
 
D
G
 
S
E
 
A
P
 
P
S
 
-
I
 
-
I
 
-
D
 
-
E
 
E
D
 
G
N
 
C
I
 
L
S
 
H
F
 
F
T
 
S
E
 
-
I
 
V
L
 
L
S
 
T
N
 
Q
I
 
A
E
 
N
P
 
E
H
 
H
E
 
D
S
 
I
I
 
P
E
 
E
Y
 
V
P
 
E
T
 
I
L
 
Q
-
 
P
D
 
D
D
 
D
L
 
V
A
 
V
V
 
A
I
 
L
I
 
P
Y
 
Y
T
x
S
S
 
S
G
 
G
T
 
T
T
 
T
G
 
G
K
 
L
P
 
P
K
 
K
G
 
G
A
 
V
M
 
M
L
 
L
T
 
T
Y
 
H
K
 
K
N
 
G
I
 
L
F
 
V
A
 
T
D
x
S
I
 
V
W
 
A
-
 
Q
-
 
Q
-
 
V
-
 
D
G
 
G
I
 
E
N
 
N
E
 
P
I
 
N
V
 
L
K
 
Y
I
 
I
T
 
H
P
 
S
K
 
E
D
 
D
R
 
V
F
 
M
I
 
L
A
 
C
Y
 
V
L
 
L
P
|
P
M
 
L
F
 
F
H
|
H
S
 
I
F
x
Y
T
 
S
M
 
L
T
 
N
V
 
S
N
 
V
I
 
L
L
 
L
L
 
C
P
 
G
L
 
L
Y
 
R
T
 
V
G
 
G
S
 
A
A
 
A
V
 
I
V
 
L
I
 
I
I
 
M
K
 
Q
-
 
K
-
x
F
S
 
D
I
 
I
M
 
V
P
 
S
F
 
F
S
 
L
N
 
E
I
 
L
I
 
I
K
 
Q
Q
 
R
T
 
Y
L
 
-
L
 
-
K
 
-
R
 
K
V
 
V
T
 
T
I
 
I
F
 
G
T
 
P
G
 
F
V
 
V
P
 
P
D
 
P
V
 
I
Y
 
V
S
 
L
A
 
A
L
 
I
S
 
-
R
 
-
A
 
A
K
 
K
L
 
S
P
 
P
F
 
M
Y
 
V
F
 
D
H
 
D
W
 
Y
-
 
D
F
 
L
N
 
S
K
 
S
V
 
V
R
 
R
F
 
T
Y
 
V
V
 
M
S
 
S
G
 
G
A
|
A
A
 
A
A
 
P
L
 
L
P
 
G
G
 
K
E
 
E
V
 
L
L
 
E
E
 
D
R
 
T
F
 
V
S
 
R
K
 
A
K
 
K
F
 
F
K
 
P
K
 
N
A
 
A
K
 
K
L
 
L
L
 
G
E
 
Q
G
 
G
Y
 
Y
G
|
G
L
 
M
S
x
T
E
|
E
T
 
A
S
 
G
P
 
P
V
 
V
V
 
L
A
 
A
V
 
M
N
 
C
R
 
L
P
 
A
Y
 
F
L
 
A
Q
 
K
K
 
E
P
 
P
-
 
F
-
 
E
-
 
I
-
 
K
-
 
S
G
 
G
S
 
A
V
 
C
G
 
G
P
 
T
A
 
V
I
 
V
P
 
R
G
 
N
V
 
A
E
 
E
V
 
M
K
 
K
I
 
I
V
 
V
N
 
D
D
 
P
E
 
K
L
 
T
-
 
G
I
 
N
E
 
S
V
 
L
P
 
P
I
 
R
G
 
N
E
 
Q
A
 
S
G
 
G
E
 
E
I
 
I
I
 
C
V
 
I
K
 
R
G
 
G
D
 
D
I
 
Q
V
 
I
M
 
M
K
 
K
G
 
G
Y
 
Y
Y
 
L
N
 
N
R
 
D
D
 
P
E
 
E
A
 
A
N
 
T
E
 
A
E
 
R
C
 
T
L
 
I
-
 
D
I
 
K
N
 
E
G
 
G
W
 
W
F
 
L
L
 
Y
T
 
T
G
 
G
D
|
D
I
 
I
G
 
G
K
 
Y
V
 
I
D
 
D
E
 
D
D
 
D
G
 
D
F
 
E
I
 
L
Y
 
F
I
 
I
L
 
V
D
 
D
R
 
R
K
 
L
K
|
K
D
 
E
L
 
L
I
 
I
I
x
K
S
 
Y
K
|
K
G
|
G
V
x
F
N
x
Q
I
 
V
Y
 
A
P
 
P
R
 
A
E
 
E
I
 
L
E
 
E
E
 
A
I
 
L
I
 
L
L
 
L
K
 
N
F
 
H
P
 
P
G
 
N
I
 
I
K
 
S
D
 
D
C
 
A
A
 
A
V
 
V
V
 
V
G
 
P
L
 
M
K
 
K
D
 
D
E
 
E
N
 
Q
H
 
A
G
 
G
E
 
E
I
 
V
P
 
P
V
 
V
A
 
A
F
 
F
I
 
V
E
 
V
V
 
R
E
 
S
E
 
N
D
 
G
M
 
S
E
 
T
V
 
I
N
 
T
E
 
E
K
 
D
D
 
E
L
 
V
R
 
K
K
 
D
Y
 
F
L
 
I
K
 
S
S
 
K
K
 
Q
L
 
V
A
 
I
N
x
F
Y
 
Y
K
 
K
L
 
R
P
 
I
K
 
K
Y
 
R
I
 
V
Y
 
F
F
 
F
V
 
V
E
 
D
N
 
A
L
 
I
P
 
P
K
 
K
N
 
S
A
 
P
T
 
S
G
 
G
K
|
K
V
 
I
L
 
L
K
 
R
R
 
K
I
 
D
L
 
L
R
 
R
E
 
A
N
 
K
I
 
L

Query Sequence

>WP_007473537.1 NCBI__GCF_000170735.1:WP_007473537.1
MKYKYNNFYELLEKNAKEIGKKTAYFIDDKKISWQDVKKKVDTFARTLELLGIKKGDKIP
IYVNNSLEFVIALFGIQKIGAVPVPINTFLKEDEISFILNDIEAEFLIASSKFEKNIPNI
REKTSVKKIIWEGEPSIIDEDNISFTEILSNIEPHESIEYPTLDDLAVIIYTSGTTGKPK
GAMLTYKNIFADIWGINEIVKITPKDRFIAYLPMFHSFTMTVNILLPLYTGSAVVIIKSI
MPFSNIIKQTLLKRVTIFTGVPDVYSALSRAKLPFYFHWFNKVRFYVSGAAALPGEVLER
FSKKFKKAKLLEGYGLSETSPVVAVNRPYLQKPGSVGPAIPGVEVKIVNDELIEVPIGEA
GEIIVKGDIVMKGYYNRDEANEECLINGWFLTGDIGKVDEDGFIYILDRKKDLIISKGVN
IYPREIEEIILKFPGIKDCAVVGLKDENHGEIPVAFIEVEEDMEVNEKDLRKYLKSKLAN
YKLPKYIYFVENLPKNATGKVLKRILRENIDKYISNKGK

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory