SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_034997810.1 NCBI__GCF_000745425.1:WP_034997810.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

P05194 3-dehydroquinate dehydratase; 3-dehydroquinase; Type I DHQase; Type I dehydroquinase; DHQ1; EC 4.2.1.10 from Escherichia coli (strain K12) (see 3 papers)
47% identity, 96% coverage: 7:256/261 of query aligns to 4:252/252 of P05194

query
sites
P05194
V
 
V
T
 
T
I
 
V
K
 
K
G
 
D
V
 
L
S
 
V
I
 
I
G
 
G
T
 
T
G
 
G
Q
 
A
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
A
K
 
K
T
 
D
H
 
I
A
 
A
E
 
S
V
 
V
L
 
K
A
 
S
G
 
E
L
 
A
A
 
L
G
 
A
L
 
Y
A
 
R
E
 
E
E
 
A
D
 
D
T
 
-
I
 
F
D
 
D
L
 
I
I
 
L
E
 
E
L
 
W
R
 
R
V
 
V
D
 
D
H
 
H
L
 
Y
D
 
A
I
 
D
A
 
L
L
 
S
D
 
N
F
 
V
G
 
E
A
 
S
V
 
V
A
 
M
A
 
A
L
 
A
T
 
A
R
 
K
E
 
I
A
 
L
A
 
R
E
 
E
I
 
T
V
 
M
P
 
P
S
 
E
K
 
K
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
 
R
T
 
S
K
 
A
A
 
K
E
 
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
A
I
 
I
D
 
S
D
 
T
E
 
E
A
 
A
Y
 
Y
G
 
I
R
 
A
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
D
I
 
Q
I
 
V
R
 
K
Q
 
E
I
 
T
I
 
V
T
 
A
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
D
A
 
V
Y
 
K
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
x
H
G
 
K
T
 
T
A
 
P
P
 
E
V
 
A
D
 
E
E
 
E
L
 
I
I
 
I
T
 
A
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
S
L
 
F
G
 
D
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
L
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
T
G
 
S
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
A
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
E
R
 
Q
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
I
I
 
I
T
 
T
M
 
M
A
 
S
M
|
M
A
 
A
G
 
K
T
 
T
G
 
G
V
 
V
I
 
I
S
 
S
R
 
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
 
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
K
A
 
A
S
 
S
A
 
A
P
 
P
G
 
G
Q
 
Q
V
 
I
P
 
S
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
T
I
 
V
L
 
L
T
 
T
L
 
I
I
 
L
H
 
H
E
 
Q
A
 
A

Q186A6 3-dehydroquinate dehydratase; 3-dehydroquinase; Type I DHQase; Type I dehydroquinase; DHQ1; EC 4.2.1.10 from Clostridioides difficile (strain 630) (Peptoclostridium difficile) (see paper)
42% identity, 96% coverage: 7:257/261 of query aligns to 5:254/255 of Q186A6

query
sites
Q186A6
V
 
V
T
 
Q
I
 
V
K
 
K
G
 
N
V
 
I
S
 
T
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
R
P
 
P
K
 
K
I
 
I
I
 
C
V
 
V
P
 
P
I
 
I
T
 
I
A
 
G
K
 
K
T
 
N
H
 
K
A
 
K
E
 
D
V
 
I
L
 
I
A
 
K
G
 
E
L
 
A
A
 
K
G
 
E
L
 
L
A
 
K
E
 
D
E
 
A
D
 
-
T
 
C
I
 
L
D
 
D
L
 
I
I
 
I
E
|
E
L
x
W
R
|
R
V
 
V
D
 
D
H
 
F
L
 
F
D
 
E
I
 
N
A
 
V
L
 
E
D
 
N
F
 
I
G
 
K
A
 
E
V
 
V
A
 
K
A
 
E
L
 
V
T
 
L
R
 
Y
E
 
E
A
 
L
A
 
R
E
 
S
I
 
Y
V
 
I
P
 
H
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
V
A
 
V
E
 
E
G
 
G
G
 
G
M
 
E
T
 
K
A
 
L
I
 
I
D
 
S
D
 
R
E
 
D
A
 
Y
Y
 
Y
G
 
T
R
 
T
F
 
L
Y
 
N
A
 
K
T
 
E
V
 
I
L
 
S
Q
 
N
E
 
T
G
 
G
K
 
L
A
 
V
D
 
D
L
 
L
I
 
I
D
 
D
V
 
V
E
 
E
L
 
L
V
 
F
R
 
M
D
 
G
E
 
D
T
 
E
I
 
V
I
 
I
R
 
D
Q
 
E
I
 
V
I
 
V
T
 
N
A
 
F
A
 
A
H
 
H
R
 
K
T
 
K
G
 
E
A
 
V
Y
 
K
V
 
V
V
 
I
L
 
I
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
N
G
 
K
T
 
T
A
 
P
P
 
K
V
 
K
D
 
E
E
 
E
L
 
I
I
 
V
T
 
S
R
 
R
L
 
L
Q
 
C
R
 
R
M
 
M
Q
 
Q
D
 
E
L
 
L
G
 
G
A
 
A
D
 
D
I
 
L
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
N
A
 
E
G
 
K
D
 
D
L
 
V
L
 
L
R
 
V
L
 
L
L
 
L
Q
 
E
A
 
A
T
 
T
W
 
N
E
 
E
M
 
M
Y
 
F
S
 
K
R
 
I
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
I
I
 
I
T
 
T
M
 
M
A
 
S
M
 
M
A
 
S
G
 
G
T
 
M
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
C
G
 
G
E
 
E
L
 
I
F
 
F
G
 
G
S
 
S
C
 
A
A
 
L
T
 
T
F
 
F
G
 
G
M
 
A
V
 
A
G
 
K
E
 
S
A
 
V
S
|
S
A
 
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
S
L
 
F
P
 
K
R
 
E
L
 
L
H
 
N
S
 
S
I
 
V
L
 
L
T
 
N
L
 
L
I
 
L
H
 
H
E
 
K
A
 
S
L
 
I

4h3dB 1.95 angstrom crystal structure of of type i 3-dehydroquinate dehydratase (arod) from clostridium difficile with covalent modified comenic acid.
42% identity, 96% coverage: 7:257/261 of query aligns to 5:254/254 of 4h3dB

query
sites
4h3dB
V
 
V
T
 
Q
I
 
V
K
 
K
G
 
N
V
 
I
S
 
T
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
R
P
 
P
K
 
K
I
 
I
I
 
C
V
 
V
P
 
P
I
 
I
T
 
I
A
 
G
K
 
K
T
 
N
H
 
K
A
 
K
E
 
D
V
 
I
L
 
I
A
 
K
G
 
E
L
 
A
A
 
K
G
 
E
L
 
L
A
 
K
E
 
D
E
 
A
D
 
-
T
 
C
I
 
L
D
 
D
L
 
I
I
 
I
E
 
E
L
 
W
R
 
R
V
 
V
D
 
D
H
 
F
L
 
F
D
 
E
I
 
N
A
 
V
L
 
E
D
 
N
F
 
I
G
 
K
A
 
E
V
 
V
A
 
K
A
 
E
L
 
V
T
 
L
R
 
Y
E
 
E
A
 
L
A
 
R
E
 
S
I
 
Y
V
 
I
P
 
H
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
 
R
T
 
S
K
 
V
A
 
V
E
|
E
G
 
G
G
 
G
M
 
E
T
 
K
A
 
L
I
 
I
D
 
S
D
 
R
E
 
D
A
 
Y
Y
 
Y
G
 
T
R
 
T
F
 
L
Y
 
N
A
 
K
T
 
E
V
 
I
L
 
S
Q
 
N
E
 
T
G
 
G
K
 
L
A
 
V
D
 
D
L
 
L
I
 
I
D
 
D
V
 
V
E
 
E
L
 
L
V
 
F
R
 
M
D
 
G
E
 
D
T
 
E
I
 
V
I
 
I
R
 
D
Q
 
E
I
 
V
I
 
V
T
 
N
A
 
F
A
 
A
H
 
H
R
 
K
T
 
K
G
 
E
A
 
V
Y
 
K
V
 
V
V
 
I
L
 
I
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
N
G
 
K
T
 
T
A
 
P
P
 
K
V
 
K
D
 
E
E
 
E
L
 
I
I
 
V
T
 
S
R
 
R
L
 
L
Q
 
C
R
 
R
M
 
M
Q
 
Q
D
 
E
L
 
L
G
 
G
A
 
A
D
 
D
I
 
L
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
N
A
 
E
G
 
K
D
 
D
L
 
V
L
 
L
R
 
V
L
 
L
L
 
L
Q
 
E
A
 
A
T
 
T
W
 
N
E
 
E
M
 
M
Y
 
F
S
 
K
R
 
I
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
I
I
 
I
T
 
T
M
|
M
A
 
S
M
 
M
A
 
S
G
 
G
T
 
M
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
C
G
 
G
E
 
E
L
 
I
F
 
F
G
 
G
S
 
S
C
 
A
A
 
L
T
 
T
F
|
F
G
 
G
M
 
A
V
 
A
G
 
K
E
 
S
A
 
V
S
 
S
A
 
A
P
 
P
G
 
G
Q
 
Q
V
 
I
P
 
S
L
 
F
P
 
K
R
 
E
L
 
L
H
 
N
S
 
S
I
 
V
L
 
L
T
 
N
L
 
L
I
 
L
H
 
H
E
 
K
A
 
S
L
 
I

3js3A Crystal structure of type i 3-dehydroquinate dehydratase (arod) from clostridium difficile with covalent reaction intermediate (see paper)
42% identity, 96% coverage: 7:256/261 of query aligns to 5:253/253 of 3js3A

query
sites
3js3A
V
 
V
T
 
Q
I
 
V
K
 
K
G
 
N
V
 
I
S
 
T
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
R
P
 
P
K
 
K
I
 
I
I
 
C
V
 
V
P
 
P
I
 
I
T
 
I
A
 
G
K
 
K
T
 
N
H
 
K
A
 
K
E
 
D
V
 
I
L
 
I
A
 
K
G
 
E
L
 
A
A
 
K
G
 
E
L
 
L
A
 
K
E
 
D
E
 
A
D
 
-
T
 
C
I
 
L
D
 
D
L
 
I
I
 
I
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
F
L
 
F
D
 
E
I
 
N
A
 
V
L
 
E
D
 
N
F
 
I
G
 
K
A
 
E
V
 
V
A
 
K
A
 
E
L
 
V
T
 
L
R
 
Y
E
 
E
A
 
L
A
 
R
E
 
S
I
 
Y
V
 
I
P
 
H
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
 
R
T
 
S
K
 
V
A
 
V
E
|
E
G
 
G
G
 
G
M
 
E
T
 
K
A
 
L
I
 
I
D
 
S
D
 
R
E
 
D
A
 
Y
Y
 
Y
G
 
T
R
 
T
F
 
L
Y
 
N
A
 
K
T
 
E
V
 
I
L
 
S
Q
 
N
E
 
T
G
 
G
K
 
L
A
 
V
D
 
D
L
 
L
I
 
I
D
 
D
V
 
V
E
 
E
L
 
L
V
 
F
R
 
M
D
 
G
E
 
D
T
 
E
I
 
V
I
 
I
R
 
D
Q
 
E
I
 
V
I
 
V
T
 
N
A
 
F
A
 
A
H
 
H
R
 
K
T
 
K
G
 
E
A
 
V
Y
 
K
V
 
V
V
 
I
L
 
I
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
N
G
 
K
T
 
T
A
 
P
P
 
K
V
 
K
D
 
E
E
 
E
L
 
I
I
 
V
T
 
S
R
 
R
L
 
L
Q
 
C
R
 
R
M
 
M
Q
 
Q
D
 
E
L
 
L
G
 
G
A
 
A
D
 
D
I
 
L
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
N
A
 
E
G
 
K
D
 
D
L
 
V
L
 
L
R
 
V
L
 
L
L
 
L
Q
 
E
A
 
A
T
 
T
W
 
N
E
 
E
M
 
M
Y
 
F
S
 
K
R
 
I
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
I
I
 
I
T
 
T
M
|
M
A
 
S
M
 
M
A
 
S
G
 
G
T
 
M
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
C
G
 
G
E
 
E
L
 
I
F
 
F
G
 
G
S
 
S
C
 
A
A
 
L
T
 
T
F
|
F
G
 
G
M
 
A
V
 
A
G
 
K
E
 
S
A
 
V
S
|
S
A
|
A
P
 
P
G
 
G
Q
 
Q
V
 
I
P
 
S
L
 
F
P
 
K
R
 
E
L
 
L
H
 
N
S
 
S
I
 
V
L
 
L
T
 
N
L
 
L
I
 
L
H
 
H
E
 
K
A
 
S

4gujA 1.50 angstrom crystal structure of the salmonella enterica 3- dehydroquinate dehydratase (arod) in complex with shikimate (see paper)
44% identity, 96% coverage: 7:256/261 of query aligns to 3:251/251 of 4gujA

query
sites
4gujA
V
 
V
T
 
T
I
 
V
K
 
R
G
 
D
V
 
L
S
 
V
I
 
V
G
 
G
T
 
E
G
 
G
Q
 
A
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
K
T
 
T
H
 
I
A
 
T
E
 
D
V
 
V
L
 
K
A
 
S
G
 
E
L
 
A
A
 
L
G
 
A
L
 
Y
A
 
R
E
 
E
E
 
A
D
 
D
T
 
-
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
L
 
F
D
 
A
I
 
N
A
 
V
L
 
T
D
 
T
F
 
A
G
 
E
A
 
S
V
 
V
A
 
L
A
 
E
L
 
A
T
 
A
R
 
G
E
 
A
A
 
I
A
 
R
E
 
E
I
 
I
V
 
I
P
 
T
S
 
D
K
 
K
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
A
I
 
L
D
 
T
D
 
T
E
 
G
A
 
Q
Y
 
Y
G
 
I
R
 
D
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
V
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
D
I
 
E
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
G
A
 
Y
A
 
A
H
 
H
R
 
Q
T
 
H
G
 
N
A
 
V
Y
 
A
V
 
V
V
 
I
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
K
T
 
T
A
 
P
P
 
A
V
 
A
D
 
E
E
 
E
L
 
I
I
 
V
T
 
Q
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
E
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
T
A
 
K
G
 
A
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
V
E
 
E
M
 
M
Y
 
Q
S
 
E
R
 
R
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
I
I
 
I
T
 
T
M
 
M
A
 
S
M
 
M
A
 
S
G
 
K
T
 
T
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
K
A
 
A
S
|
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
S
L
 
V
P
 
A
R
 
D
L
 
L
H
 
R
S
 
T
I
 
V
L
 
L
T
 
T
L
 
I
I
 
L
H
 
H
E
 
Q
A
 
A

4guiA 1.78 angstrom crystal structure of the salmonella enterica 3- dehydroquinate dehydratase (arod) in complex with quinate (see paper)
44% identity, 96% coverage: 7:256/261 of query aligns to 3:251/251 of 4guiA

query
sites
4guiA
V
 
V
T
 
T
I
 
V
K
 
R
G
 
D
V
 
L
S
 
V
I
 
V
G
 
G
T
 
E
G
 
G
Q
 
A
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
K
T
 
T
H
 
I
A
 
T
E
 
D
V
 
V
L
 
K
A
 
S
G
 
E
L
 
A
A
 
L
G
 
A
L
 
Y
A
 
R
E
 
E
E
 
A
D
 
D
T
 
-
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
L
 
F
D
 
A
I
 
N
A
 
V
L
 
T
D
 
T
F
 
A
G
 
E
A
 
S
V
 
V
A
 
L
A
 
E
L
 
A
T
 
A
R
 
G
E
 
A
A
 
I
A
 
R
E
 
E
I
 
I
V
 
I
P
 
T
S
 
D
K
 
K
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
A
I
 
L
D
 
T
D
 
T
E
 
G
A
 
Q
Y
 
Y
G
 
I
R
 
D
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
V
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
D
I
 
E
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
G
A
 
Y
A
 
A
H
 
H
R
 
Q
T
 
H
G
 
N
A
 
V
Y
 
A
V
 
V
V
 
I
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
K
T
 
T
A
 
P
P
 
A
V
 
A
D
 
E
E
 
E
L
 
I
I
 
V
T
 
Q
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
E
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
T
A
 
K
G
 
A
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
V
E
 
E
M
 
M
Y
 
Q
S
 
E
R
 
R
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
I
I
 
I
T
 
T
M
 
M
A
 
S
M
|
M
A
 
S
G
 
K
T
 
T
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
K
A
 
A
S
 
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
S
L
 
V
P
 
A
R
 
D
L
 
L
H
 
R
S
 
T
I
 
V
L
 
L
T
 
T
L
 
I
I
 
L
H
 
H
E
 
Q
A
 
A

3m7wA Crystal structure of type i 3-dehydroquinate dehydratase (arod) from salmonella typhimurium lt2 in covalent complex with dehydroquinate (see paper)
44% identity, 96% coverage: 7:256/261 of query aligns to 3:251/251 of 3m7wA

query
sites
3m7wA
V
 
V
T
 
T
I
 
V
K
 
R
G
 
D
V
 
L
S
 
V
I
 
V
G
 
G
T
 
E
G
 
G
Q
 
A
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
K
T
 
T
H
 
I
A
 
T
E
 
D
V
 
V
L
 
K
A
 
S
G
 
E
L
 
A
A
 
L
G
 
A
L
 
Y
A
 
R
E
 
E
E
 
A
D
 
D
T
 
-
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
L
 
F
D
 
A
I
 
N
A
 
V
L
 
T
D
 
T
F
 
A
G
 
E
A
 
S
V
 
V
A
 
L
A
 
E
L
 
A
T
 
A
R
 
G
E
 
A
A
 
I
A
 
R
E
 
E
I
 
I
V
 
I
P
 
T
S
 
D
K
 
K
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
 
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
A
I
 
L
D
 
T
D
 
T
E
 
G
A
 
Q
Y
 
Y
G
 
I
R
 
D
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
V
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
D
I
 
E
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
G
A
 
Y
A
 
A
H
 
H
R
 
Q
T
 
H
G
 
N
A
 
V
Y
 
A
V
 
V
V
 
I
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
K
T
 
T
A
 
P
P
 
A
V
 
A
D
 
E
E
 
E
L
 
I
I
 
V
T
 
Q
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
E
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
T
A
 
K
G
 
A
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
V
E
 
E
M
 
M
Y
 
Q
S
 
E
R
 
R
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
I
I
 
I
T
 
T
M
|
M
A
 
S
M
|
M
A
 
S
G
 
K
T
 
T
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
K
A
 
A
S
 
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
S
L
 
V
P
 
A
R
 
D
L
 
L
H
 
R
S
 
T
I
 
V
L
 
L
T
 
T
L
 
I
I
 
L
H
 
H
E
 
Q
A
 
A

P58687 3-dehydroquinate dehydratase; 3-dehydroquinase; DHQD; Type I DHQase; Type I dehydroquinase; DHQ1; EC 4.2.1.10 from Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720) (see 4 papers)
44% identity, 96% coverage: 7:256/261 of query aligns to 4:252/252 of P58687

query
sites
P58687
V
 
V
T
 
T
I
 
V
K
 
R
G
 
D
V
 
L
S
 
V
I
 
V
G
 
G
T
 
E
G
 
G
Q
 
A
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
x
S
I
 
L
T
 
M
A
 
G
K
 
K
T
 
T
H
 
I
A
 
T
E
 
D
V
 
V
L
 
K
A
 
S
G
 
E
L
 
A
A
 
L
G
 
A
L
 
Y
A
 
R
E
 
E
E
 
A
D
 
D
T
 
-
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
x
W
R
|
R
V
 
V
D
 
D
H
 
H
L
 
F
D
 
A
I
 
N
A
 
V
L
 
T
D
 
T
F
 
A
G
 
E
A
 
S
V
 
V
A
 
L
A
 
E
L
 
A
T
 
A
R
 
G
E
 
A
A
 
I
A
 
R
E
 
E
I
 
I
V
 
I
P
 
T
S
 
D
K
 
K
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
A
I
 
L
D
 
T
D
 
T
E
 
G
A
 
Q
Y
 
Y
G
 
I
R
 
D
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
V
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
D
I
 
E
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
G
A
 
Y
A
 
A
H
 
H
R
 
Q
T
 
H
G
 
N
A
 
V
Y
 
A
V
 
V
V
 
I
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
K
T
 
T
A
 
P
P
 
A
V
 
A
D
 
E
E
 
E
L
 
I
I
 
V
T
 
Q
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
E
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
T
A
 
K
G
 
A
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
V
E
 
E
M
 
M
Y
 
Q
S
 
E
R
 
R
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
I
I
 
I
T
 
T
M
 
M
A
 
S
M
 
M
A
 
S
G
 
K
T
 
T
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
 
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
K
A
 
A
S
|
S
A
 
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
S
L
 
V
P
 
A
R
 
D
L
 
L
H
 
R
S
 
T
I
 
V
L
 
L
T
 
T
L
 
I
I
 
L
H
 
H
E
 
Q
A
 
A

1l9wA Crystal structure of 3-dehydroquinase from salmonella typhi complexed with reaction product (see paper)
45% identity, 96% coverage: 7:256/261 of query aligns to 4:252/252 of 1l9wA

query
sites
1l9wA
V
 
V
T
 
T
I
 
V
K
 
K
G
 
N
V
 
L
S
 
I
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
M
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
R
-
 
D
-
 
I
-
 
N
-
 
S
T
 
V
H
 
K
A
 
A
E
 
E
V
 
A
L
 
L
A
 
A
G
 
-
L
 
-
A
 
-
G
 
-
L
 
-
A
 
Y
E
 
R
E
 
E
D
 
A
T
 
T
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
-
 
F
L
 
M
D
 
D
I
 
I
A
 
A
L
 
-
D
 
S
F
 
T
G
 
Q
A
 
S
V
 
V
A
 
L
A
 
T
L
 
A
T
 
A
R
 
R
E
 
V
A
 
I
A
 
R
E
 
D
I
 
A
V
 
M
P
 
P
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
T
I
 
I
D
 
T
D
 
T
E
 
Q
A
 
H
Y
 
Y
G
 
L
R
 
T
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
A
I
 
D
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
D
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
N
A
 
V
Y
 
Y
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
Q
T
 
T
A
 
P
P
 
S
V
 
A
D
 
E
E
 
E
L
 
M
I
 
V
T
 
S
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
A
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
K
G
 
H
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
Q
R
 
H
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
V
I
 
I
T
 
T
M
 
M
A
 
S
M
 
M
A
 
A
G
 
K
T
 
E
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
Q
A
 
A
S
|
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
A
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
S
I
 
V
L
 
L
T
 
M
L
 
I
I
 
L
H
 
H
E
 
N
A
 
A

4uioA Structure of the salmonella typhi type i dehydroquinase covalently inhibited by a 3-dehydroquinic acid derivative (see paper)
45% identity, 96% coverage: 7:256/261 of query aligns to 2:250/250 of 4uioA

query
sites
4uioA
V
 
V
T
 
T
I
 
V
K
 
K
G
 
N
V
 
L
S
 
I
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
M
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
R
-
 
D
-
 
I
-
 
N
-
 
S
T
 
V
H
 
K
A
 
A
E
 
E
V
 
A
L
 
L
A
 
A
G
 
-
L
 
-
A
 
-
G
 
-
L
 
-
A
 
Y
E
 
R
E
 
E
D
 
A
T
 
T
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
-
 
F
L
 
M
D
 
D
I
 
I
A
 
A
L
 
-
D
 
S
F
 
T
G
 
Q
A
 
S
V
 
V
A
 
L
A
 
T
L
 
A
T
 
A
R
 
R
E
 
V
A
 
I
A
 
R
E
 
D
I
 
A
V
 
M
P
 
P
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
T
I
 
I
D
 
T
D
 
T
E
 
Q
A
 
H
Y
 
Y
G
 
L
R
 
T
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
A
I
 
D
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
D
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
N
A
 
V
Y
 
Y
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
Q
T
 
T
A
 
P
P
 
S
V
 
A
D
 
E
E
 
E
L
 
M
I
 
V
T
 
L
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
A
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
K
G
 
H
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
Q
R
 
H
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
V
I
 
I
T
 
T
M
 
M
A
 
S
M
|
M
A
 
A
G
 
K
T
 
E
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
Q
A
 
A
S
 
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
A
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
S
I
 
V
L
 
L
T
 
M
L
 
I
I
 
L
H
 
H
E
 
N
A
 
A

4clmB Structure of salmonella typhi type i dehydroquinase irreversibly inhibited with a 1,3,4-trihydroxyciclohexane-1-carboxylic acid derivative (see paper)
45% identity, 96% coverage: 7:256/261 of query aligns to 3:251/251 of 4clmB

query
sites
4clmB
V
 
V
T
 
T
I
 
V
K
 
K
G
 
N
V
 
L
S
 
I
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
M
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
R
-
 
D
-
 
I
-
 
N
-
 
S
T
 
V
H
 
K
A
 
A
E
 
E
V
 
A
L
 
L
A
 
A
G
 
-
L
 
-
A
 
-
G
 
-
L
 
-
A
 
Y
E
 
R
E
 
E
D
 
A
T
 
T
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
-
 
F
L
 
M
D
 
D
I
 
I
A
 
A
L
 
-
D
 
S
F
 
T
G
 
Q
A
 
S
V
 
V
A
 
L
A
 
T
L
 
A
T
 
A
R
 
R
E
 
V
A
 
I
A
 
R
E
 
D
I
 
A
V
 
M
P
 
P
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
T
I
 
I
D
 
T
D
 
T
E
 
Q
A
 
H
Y
 
Y
G
 
L
R
 
T
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
A
I
 
D
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
D
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
N
A
 
V
Y
 
Y
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
Q
T
 
T
A
 
P
P
 
S
V
 
A
D
 
E
E
 
E
L
 
M
I
 
V
T
 
L
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
A
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
K
G
 
H
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
Q
R
 
H
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
V
I
 
I
T
 
T
M
 
M
A
 
S
M
|
M
A
 
A
G
 
K
T
 
E
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
Q
A
 
A
S
|
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
A
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
S
I
 
V
L
 
L
T
 
M
L
 
I
I
 
L
H
 
H
E
 
N
A
 
A

8b2cAAA 3-dehydroquinate dehydratase (see paper)
45% identity, 96% coverage: 7:256/261 of query aligns to 4:252/252 of 8b2cAAA

query
sites
8b2cAAA
V
 
V
T
 
T
I
 
V
K
 
K
G
 
N
V
 
L
S
 
I
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
M
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
R
-
 
D
-
 
I
-
 
N
-
 
S
T
 
V
H
 
K
A
 
A
E
 
E
V
 
A
L
 
L
A
 
A
G
 
-
L
 
-
A
 
-
G
 
-
L
 
-
A
 
Y
E
 
R
E
 
E
D
 
A
T
 
T
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
-
 
F
L
 
M
D
 
D
I
 
I
A
 
A
L
 
-
D
 
S
F
 
T
G
 
Q
A
 
S
V
 
V
A
 
L
A
 
T
L
 
A
T
 
A
R
 
R
E
 
V
A
 
I
A
 
R
E
 
D
I
 
A
V
 
M
P
 
P
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
 
R
T
 
S
K
 
A
A
 
K
E
 
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
T
I
 
I
D
 
T
D
 
T
E
 
Q
A
 
H
Y
 
Y
G
 
L
R
 
T
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
A
I
 
D
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
D
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
N
A
 
V
Y
 
Y
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
Q
T
 
T
A
 
P
P
 
S
V
 
A
D
 
E
E
 
E
L
 
M
I
 
V
T
 
L
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
A
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
K
G
 
H
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
Q
R
 
H
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
V
I
 
I
T
 
T
M
 
M
A
 
S
M
|
M
A
 
A
G
 
K
T
 
E
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
Q
A
 
A
S
 
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
A
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
S
I
 
V
L
 
L
T
 
M
L
 
I
I
 
L
H
 
H
E
 
N
A
 
A

8b2bAAA 3-dehydroquinate dehydratase (see paper)
45% identity, 96% coverage: 7:256/261 of query aligns to 4:252/252 of 8b2bAAA

query
sites
8b2bAAA
V
 
V
T
 
T
I
 
V
K
 
K
G
 
N
V
 
L
S
 
I
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
M
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
R
-
 
D
-
 
I
-
 
N
-
 
S
T
 
V
H
 
K
A
 
A
E
 
E
V
 
A
L
 
L
A
 
A
G
 
-
L
 
-
A
 
-
G
 
-
L
 
-
A
 
Y
E
 
R
E
 
E
D
 
A
T
 
T
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
-
 
F
L
 
M
D
 
D
I
 
I
A
 
A
L
 
-
D
 
S
F
 
T
G
 
Q
A
 
S
V
 
V
A
 
L
A
 
T
L
 
A
T
 
A
R
 
R
E
 
V
A
 
I
A
 
R
E
 
D
I
 
A
V
 
M
P
 
P
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
 
R
T
 
S
K
 
A
A
 
K
E
 
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
T
I
 
I
D
 
T
D
 
T
E
 
Q
A
 
H
Y
 
Y
G
 
L
R
 
T
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
A
I
 
D
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
D
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
N
A
 
V
Y
 
Y
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
Q
T
 
T
A
 
P
P
 
S
V
 
A
D
 
E
E
 
E
L
 
M
I
 
V
T
 
L
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
A
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
K
G
 
H
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
Q
R
 
H
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
V
I
 
I
T
 
T
M
 
M
A
 
S
M
 
M
A
 
A
G
 
K
T
 
E
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
Q
A
 
A
S
|
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
A
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
S
I
 
V
L
 
L
T
 
M
L
 
I
I
 
L
H
 
H
E
 
N
A
 
A

6sfeA Crystal structure of dhq1 from salmonella typhi covalently modified by compound 7 (see paper)
45% identity, 96% coverage: 7:256/261 of query aligns to 4:252/252 of 6sfeA

query
sites
6sfeA
V
 
V
T
 
T
I
 
V
K
 
K
G
 
N
V
 
L
S
 
I
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
M
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
R
-
 
D
-
 
I
-
 
N
-
 
S
T
 
V
H
 
K
A
 
A
E
 
E
V
 
A
L
 
L
A
 
A
G
 
-
L
 
-
A
 
-
G
 
-
L
 
-
A
 
Y
E
 
R
E
 
E
D
 
A
T
 
T
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
-
 
F
L
 
M
D
 
D
I
 
I
A
 
A
L
 
-
D
 
S
F
 
T
G
 
Q
A
 
S
V
 
V
A
 
L
A
 
T
L
 
A
T
 
A
R
 
R
E
 
V
A
 
I
A
 
R
E
 
D
I
 
A
V
 
M
P
 
P
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
T
I
 
I
D
 
T
D
 
T
E
 
Q
A
 
H
Y
 
Y
G
 
L
R
 
T
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
A
I
 
D
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
D
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
N
A
 
V
Y
 
Y
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
Q
T
 
T
A
 
P
P
 
S
V
 
A
D
 
E
E
 
E
L
 
M
I
 
V
T
 
L
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
A
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
K
G
 
H
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
Q
R
 
H
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
V
I
 
I
T
 
T
M
 
M
A
 
S
M
 
M
A
 
A
G
 
K
T
 
E
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
Q
A
 
A
S
|
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
A
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
S
I
 
V
L
 
L
T
 
M
L
 
I
I
 
L
H
 
H
E
 
N
A
 
A

6h5jA Crystal structure of dhq1 from salmonella typhi covalently modified by ligand 4
45% identity, 96% coverage: 7:256/261 of query aligns to 4:252/252 of 6h5jA

query
sites
6h5jA
V
 
V
T
 
T
I
 
V
K
 
K
G
 
N
V
 
L
S
 
I
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
M
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
R
-
 
D
-
 
I
-
 
N
-
 
S
T
 
V
H
 
K
A
 
A
E
 
E
V
 
A
L
 
L
A
 
A
G
 
-
L
 
-
A
 
-
G
 
-
L
 
-
A
 
Y
E
 
R
E
 
E
D
 
A
T
 
T
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
-
 
F
L
 
M
D
 
D
I
 
I
A
 
A
L
 
-
D
 
S
F
 
T
G
 
Q
A
 
S
V
 
V
A
 
L
A
 
T
L
 
A
T
 
A
R
 
R
E
 
V
A
 
I
A
 
R
E
 
D
I
 
A
V
 
M
P
 
P
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
T
I
 
I
D
 
T
D
 
T
E
 
Q
A
 
H
Y
 
Y
G
 
L
R
 
T
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
A
I
 
D
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
D
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
N
A
 
V
Y
 
Y
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
Q
T
 
T
A
 
P
P
 
S
V
 
A
D
 
E
E
 
E
L
 
M
I
 
V
T
 
L
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
A
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
K
G
 
H
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
Q
R
 
H
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
V
I
 
I
T
 
T
M
 
M
A
 
S
M
 
M
A
 
A
G
 
K
T
 
E
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
Q
A
 
A
S
|
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
A
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
S
I
 
V
L
 
L
T
 
M
L
 
I
I
 
L
H
 
H
E
 
N
A
 
A

6h5gA Crystal structure of dhq1 from salmonella typhi covalently modified by ligand 3
45% identity, 96% coverage: 7:256/261 of query aligns to 4:252/252 of 6h5gA

query
sites
6h5gA
V
 
V
T
 
T
I
 
V
K
 
K
G
 
N
V
 
L
S
 
I
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
M
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
R
-
 
D
-
 
I
-
 
N
-
 
S
T
 
V
H
 
K
A
 
A
E
 
E
V
 
A
L
 
L
A
 
A
G
 
-
L
 
-
A
 
-
G
 
-
L
 
-
A
 
Y
E
 
R
E
 
E
D
 
A
T
 
T
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
-
 
F
L
 
M
D
 
D
I
 
I
A
 
A
L
 
-
D
 
S
F
 
T
G
 
Q
A
 
S
V
 
V
A
 
L
A
 
T
L
 
A
T
 
A
R
 
R
E
 
V
A
 
I
A
 
R
E
 
D
I
 
A
V
 
M
P
 
P
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
T
I
 
I
D
 
T
D
 
T
E
 
Q
A
 
H
Y
 
Y
G
 
L
R
 
T
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
A
I
 
D
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
D
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
N
A
 
V
Y
 
Y
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
Q
T
 
T
A
 
P
P
 
S
V
 
A
D
 
E
E
 
E
L
 
M
I
 
V
T
 
L
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
A
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
K
G
 
H
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
Q
R
 
H
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
V
I
 
I
T
 
T
M
|
M
A
 
S
M
 
M
A
 
A
G
 
K
T
 
E
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
Q
A
 
A
S
|
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
A
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
S
I
 
V
L
 
L
T
 
M
L
 
I
I
 
L
H
 
H
E
 
N
A
 
A

6h5cA Crystal structure of dhq1 from salmonella typhi covalently modified by ligand 1
45% identity, 96% coverage: 7:256/261 of query aligns to 4:252/252 of 6h5cA

query
sites
6h5cA
V
 
V
T
 
T
I
 
V
K
 
K
G
 
N
V
 
L
S
 
I
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
M
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
R
-
 
D
-
 
I
-
 
N
-
 
S
T
 
V
H
 
K
A
 
A
E
 
E
V
 
A
L
 
L
A
 
A
G
 
-
L
 
-
A
 
-
G
 
-
L
 
-
A
 
Y
E
 
R
E
 
E
D
 
A
T
 
T
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
-
 
F
L
 
M
D
 
D
I
 
I
A
 
A
L
 
-
D
 
S
F
 
T
G
 
Q
A
 
S
V
 
V
A
 
L
A
 
T
L
 
A
T
 
A
R
 
R
E
 
V
A
 
I
A
 
R
E
 
D
I
 
A
V
 
M
P
 
P
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
T
I
 
I
D
 
T
D
 
T
E
 
Q
A
 
H
Y
 
Y
G
 
L
R
 
T
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
A
I
 
D
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
D
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
N
A
 
V
Y
 
Y
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
Q
T
 
T
A
 
P
P
 
S
V
 
A
D
 
E
E
 
E
L
 
M
I
 
V
T
 
L
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
A
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
K
G
 
H
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
Q
R
 
H
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
V
I
 
I
T
 
T
M
 
M
A
 
S
M
 
M
A
 
A
G
 
K
T
 
E
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
Q
A
 
A
S
|
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
A
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
S
I
 
V
L
 
L
T
 
M
L
 
I
I
 
L
H
 
H
E
 
N
A
 
A

4cnpA Structure of the salmonella typhi type i dehydroquinase inhibited by a 3-epiquinic acid derivative
45% identity, 96% coverage: 7:256/261 of query aligns to 4:252/252 of 4cnpA

query
sites
4cnpA
V
 
V
T
 
T
I
 
V
K
 
K
G
 
N
V
 
L
S
 
I
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
M
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
R
-
 
D
-
 
I
-
 
N
-
 
S
T
 
V
H
 
K
A
 
A
E
 
E
V
 
A
L
 
L
A
 
A
G
 
-
L
 
-
A
 
-
G
 
-
L
 
-
A
 
Y
E
 
R
E
 
E
D
 
A
T
 
T
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
-
 
F
L
 
M
D
 
D
I
 
I
A
 
A
L
 
-
D
 
S
F
 
T
G
 
Q
A
 
S
V
 
V
A
 
L
A
 
T
L
 
A
T
 
A
R
 
R
E
 
V
A
 
I
A
 
R
E
 
D
I
 
A
V
 
M
P
 
P
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
|
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
T
I
 
I
D
 
T
D
 
T
E
 
Q
A
 
H
Y
 
Y
G
 
L
R
 
T
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
A
I
 
D
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
D
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
N
A
 
V
Y
 
Y
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
Q
T
 
T
A
 
P
P
 
S
V
 
A
D
 
E
E
 
E
L
 
M
I
 
V
T
 
L
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
A
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
K
G
 
H
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
Q
R
 
H
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
V
I
 
I
T
 
T
M
|
M
A
 
S
M
 
M
A
 
A
G
 
K
T
 
E
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
Q
A
 
A
S
|
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
A
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
S
I
 
V
L
 
L
T
 
M
L
 
I
I
 
L
H
 
H
E
 
N
A
 
A

P24670 3-dehydroquinate dehydratase; 3-dehydroquinase; Type I DHQase; Type I dehydroquinase; DHQ1; EC 4.2.1.10 from Salmonella typhi (see 3 papers)
45% identity, 96% coverage: 7:256/261 of query aligns to 4:252/252 of P24670

query
sites
P24670
V
 
V
T
 
T
I
 
V
K
 
K
G
 
N
V
 
L
S
 
I
I
 
I
G
 
G
T
 
E
G
 
G
Q
 
M
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
x
S
I
 
L
T
 
M
A
 
G
K
 
R
-
 
D
-
 
I
-
 
N
-
 
S
T
 
V
H
 
K
A
 
A
E
 
E
V
 
A
L
 
L
A
 
A
G
 
-
L
 
-
A
 
-
G
 
-
L
 
-
A
 
Y
E
 
R
E
 
E
D
 
A
T
 
T
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
x
W
R
|
R
V
 
V
D
 
D
H
 
H
-
 
F
L
 
M
D
 
D
I
 
I
A
 
A
L
 
-
D
 
S
F
 
T
G
 
Q
A
 
S
V
 
V
A
 
L
A
 
T
L
 
A
T
 
A
R
 
R
E
 
V
A
 
I
A
 
R
E
 
D
I
 
A
V
 
M
P
 
P
S
 
D
K
 
I
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
 
E
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
T
I
 
I
D
 
T
D
 
T
E
 
Q
A
 
H
Y
 
Y
G
 
L
R
 
T
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
I
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
A
I
 
D
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
D
A
 
Y
A
 
A
H
 
H
R
 
A
T
 
H
G
 
N
A
 
V
Y
 
Y
V
 
V
V
 
V
L
 
M
S
 
S
N
 
N
H
 
H
D
 
D
F
 
F
A
 
H
G
 
Q
T
 
T
A
 
P
P
 
S
V
 
A
D
 
E
E
 
E
L
 
M
I
 
V
T
 
L
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
A
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
S
A
 
K
G
 
H
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
L
E
 
E
M
 
M
Y
 
Q
S
 
Q
R
 
H
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
V
I
 
I
T
 
T
M
 
M
A
 
S
M
 
M
A
 
A
G
 
K
T
 
E
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
 
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
Q
A
 
A
S
|
S
A
 
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
A
L
 
V
P
 
N
R
 
D
L
 
L
H
 
R
S
 
S
I
 
V
L
 
L
T
 
M
L
 
I
I
 
L
H
 
H
E
 
N
A
 
A

4guhB 1.95 angstrom crystal structure of the salmonella enterica 3- dehydroquinate dehydratase (arod) e86a mutant in complex with dehydroshikimate (crystal form #2) (see paper)
43% identity, 96% coverage: 7:256/261 of query aligns to 17:265/265 of 4guhB

query
sites
4guhB
V
 
V
T
 
T
I
 
V
K
 
R
G
 
D
V
 
L
S
 
V
I
 
V
G
 
G
T
 
E
G
 
G
Q
 
A
P
 
P
K
 
K
I
 
I
I
 
I
V
 
V
P
 
S
I
 
L
T
 
M
A
 
G
K
 
K
T
 
T
H
 
I
A
 
T
E
 
D
V
 
V
L
 
K
A
 
S
G
 
E
L
 
A
A
 
L
G
 
A
L
 
Y
A
 
R
E
 
E
E
 
A
D
 
D
T
 
-
I
 
F
D
 
D
L
 
I
I
 
L
E
|
E
L
 
W
R
|
R
V
 
V
D
 
D
H
 
H
L
 
F
D
 
A
I
 
N
A
 
V
L
 
T
D
 
T
F
 
A
G
 
E
A
 
S
V
 
V
A
 
L
A
 
E
L
 
A
T
 
A
R
 
G
E
 
A
A
 
I
A
 
R
E
 
E
I
 
I
V
 
I
P
 
T
S
 
D
K
 
K
P
 
P
L
 
L
L
 
L
V
 
F
T
 
T
F
 
F
R
|
R
T
 
S
K
 
A
A
 
K
E
x
A
G
 
G
G
 
G
M
 
E
T
 
Q
A
 
A
I
 
L
D
 
T
D
 
T
E
 
G
A
 
Q
Y
 
Y
G
 
I
R
 
D
F
 
L
Y
 
N
A
 
R
T
 
A
V
 
A
L
 
V
Q
 
D
E
 
S
G
 
G
K
 
L
A
 
V
D
 
D
L
 
M
I
 
I
D
 
D
V
 
L
E
 
E
L
 
L
V
 
F
R
 
T
D
 
G
E
 
D
T
 
D
I
 
E
I
 
V
R
 
K
Q
 
A
I
 
T
I
 
V
T
 
G
A
 
Y
A
 
A
H
 
H
R
 
Q
T
 
H
G
 
N
A
 
V
Y
 
A
V
 
V
V
 
I
L
 
M
S
 
S
N
 
N
H
|
H
D
 
D
F
 
F
A
 
H
G
 
K
T
 
T
A
 
P
P
 
A
V
 
A
D
 
E
E
 
E
L
 
I
I
 
V
T
 
Q
R
 
R
L
 
L
Q
 
R
R
 
K
M
 
M
Q
 
Q
D
 
E
L
 
L
G
 
G
A
 
A
D
 
D
I
 
I
I
 
P
K
|
K
I
 
I
A
 
A
T
 
V
M
 
M
P
 
P
K
 
Q
D
 
T
A
 
K
G
 
A
D
 
D
L
 
V
L
 
L
R
 
T
L
 
L
L
 
L
Q
 
T
A
 
A
T
 
T
W
 
V
E
 
E
M
 
M
Y
 
Q
S
 
E
R
 
R
Y
 
Y
A
 
A
T
 
D
C
 
R
P
 
P
M
 
I
I
 
I
T
 
T
M
|
M
A
 
S
M
 
M
A
 
S
G
 
K
T
 
T
G
 
G
V
 
V
I
 
I
S
 
S
R
|
R
L
 
L
S
 
A
G
 
G
E
 
E
L
 
V
F
 
F
G
 
G
S
 
S
C
 
A
A
 
A
T
 
T
F
|
F
G
 
G
M
 
A
V
 
V
G
 
K
E
 
K
A
 
A
S
 
S
A
|
A
P
 
P
G
 
G
Q
|
Q
V
 
I
P
 
S
L
 
V
P
 
A
R
 
D
L
 
L
H
 
R
S
 
T
I
 
V
L
 
L
T
 
T
L
 
I
I
 
L
H
 
H
E
 
Q
A
 
A

Query Sequence

>WP_034997810.1 NCBI__GCF_000745425.1:WP_034997810.1
MIETPVVTIKGVSIGTGQPKIIVPITAKTHAEVLAGLAGLAEEDTIDLIELRVDHLDIAL
DFGAVAALTREAAEIVPSKPLLVTFRTKAEGGMTAIDDEAYGRFYATVLQEGKADLIDVE
LVRDETIIRQIITAAHRTGAYVVLSNHDFAGTAPVDELITRLQRMQDLGADIIKIATMPK
DAGDLLRLLQATWEMYSRYATCPMITMAMAGTGVISRLSGELFGSCATFGMVGEASAPGQ
VPLPRLHSILTLIHEALAPRS

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory