SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_008482535.1 NCBI__GCF_000299915.1:WP_008482535.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

7p7wBBB Ubiquitin-like protein SMT3,N-acetyl-D-glucosamine kinase
42% identity, 98% coverage: 1:295/300 of query aligns to 5:304/306 of 7p7wBBB

query
sites
7p7wBBB
M
 
M
I
 
Y
Y
 
Y
G
 
G
L
 
F
D
 
D
V
 
I
G
 
G
G
 
G
T
 
T
K
 
K
M
 
I
E
 
E
L
 
F
G
 
G
C
 
A
F
 
F
D
 
D
A
 
A
Q
 
D
L
 
L
N
 
V
D
 
R
L
 
V
E
 
A
R
 
R
C
 
E
R
 
R
V
 
V
A
 
A
T
 
T
P
 
P
A
 
T
R
 
E
D
 
S
Y
 
Y
P
 
A
A
 
A
L
 
F
L
 
L
N
 
D
T
 
A
I
 
I
A
 
V
A
 
T
L
 
L
V
 
V
A
 
N
D
 
N
A
 
A
R
 
D
L
 
A
R
 
E
H
 
F
G
 
G
-
 
V
P
 
K
G
 
G
P
 
T
L
 
V
G
 
G
I
 
I
A
 
G
L
 
I
P
 
P
G
 
G
L
 
I
V
 
A
D
 
D
G
 
V
Q
 
E
-
 
T
G
 
G
L
 
K
S
 
L
L
 
L
C
 
T
A
 
S
N
 
N
L
 
I
P
 
P
G
 
A
A
 
A
T
 
M
G
 
G
R
 
H
P
 
T
L
 
L
G
 
Q
A
 
R
D
 
D
L
 
L
A
 
E
R
 
E
R
 
R
L
 
L
G
 
Q
Q
 
R
P
 
P
L
 
V
T
 
K
L
 
I
G
 
E
N
 
N
D
 
D
C
 
A
R
 
N
C
 
C
F
 
F
A
 
A
L
 
L
S
 
S
E
 
E
A
 
A
L
 
W
G
 
D
G
 
E
A
 
D
G
 
L
A
 
R
G
 
G
Y
 
E
R
 
P
R
 
S
V
 
V
F
 
L
G
 
G
A
 
L
V
 
I
L
 
L
G
|
G
T
|
T
G
 
G
A
 
V
A
 
G
G
 
G
G
 
G
L
 
L
V
 
I
V
 
F
D
 
N
G
 
G
L
 
K
L
 
V
Y
 
H
Q
 
S
G
 
G
R
 
R
Q
 
A
D
 
N
I
 
I
A
 
A
C
 
G
E
 
E
Y
 
I
G
 
G
H
|
H
Q
 
T
P
 
R
L
 
L
P
 
P
A
 
Y
-
 
D
-
 
A
-
 
L
R
 
K
L
 
L
L
 
L
L
 
G
R
 
M
Y
 
E
Q
 
N
L
 
A
P
 
P
L
 
I
W
 
F
T
 
P
C
|
C
G
 
G
C
|
C
G
 
K
Q
 
N
Q
 
S
G
 
G
C
|
C
Y
 
I
E
 
D
A
 
N
Y
 
Y
V
 
L
S
 
S
G
|
G
P
 
R
G
 
G
L
 
F
A
x
E
R
 
Q
L
 
L
Y
 
Y
G
 
D
H
 
H
F
 
Y
G
 
F
G
 
S
Q
 
E
A
 
K
E
 
L
D
 
S
A
 
A
A
 
P
A
 
E
V
 
I
L
 
I
A
 
A
L
 
H
W
 
Y
R
 
E
R
 
Q
A
 
G
E
 
E
P
 
R
L
 
R
A
 
A
Q
 
V
A
 
Q
T
 
H
L
 
V
D
 
E
C
 
R
Y
 
F
L
 
M
D
 
E
L
 
L
L
 
L
G
 
A
A
 
I
C
 
C
F
 
L
A
 
A
G
 
N
L
 
I
V
 
F
L
 
T
A
 
C
Y
 
L
D
 
D
P
 
P
D
 
H
L
 
V
I
 
V
V
 
V
L
 
L
G
 
G
G
|
G
G
|
G
L
 
L
S
 
S
K
x
N
V
 
F
P
 
E
E
 
L
L
 
I
Y
 
Y
Q
 
Q
L
 
E
L
 
L
P
 
P
A
 
K
R
 
R
I
 
L
D
 
P
A
 
A
C
 
H
L
 
L
F
 
L
G
 
H
P
 
V
F
 
A
Q
 
K
S
 
L
P
 
P
P
 
K
L
 
I
V
 
I
P
 
K
A
 
A
R
 
R
F
 
H
G
 
G
D
 
D
A
 
A
S
 
G
G
 
G
A
 
V
R
 
R
G
 
G
I
 
A
A
 
A
L
 
F
L
 
L

7p9lAAA Ubiquitin-like protein SMT3,N-acetyl-D-glucosamine kinase
42% identity, 98% coverage: 1:295/300 of query aligns to 2:301/303 of 7p9lAAA

query
sites
7p9lAAA
M
 
M
I
 
Y
Y
 
Y
G
 
G
L
 
F
D
 
D
V
 
I
G
 
G
G
 
G
T
 
T
K
 
K
M
 
I
E
 
E
L
 
F
G
 
G
C
 
A
F
 
F
D
 
D
A
 
A
Q
 
D
L
 
L
N
 
V
D
 
R
L
 
V
E
 
A
R
 
R
C
 
E
R
 
R
V
 
V
A
 
A
T
 
T
P
 
P
A
 
T
R
 
E
D
 
S
Y
 
Y
P
 
A
A
 
A
L
 
F
L
 
L
N
 
D
T
 
A
I
 
I
A
 
V
A
 
T
L
 
L
V
 
V
A
 
N
D
 
N
A
 
A
R
 
D
L
 
A
R
 
E
H
 
F
G
 
G
-
 
V
P
 
K
G
 
G
P
 
T
L
 
V
G
 
G
I
 
I
A
 
G
L
 
I
P
|
P
G
|
G
L
 
I
V
 
A
D
 
D
G
 
V
Q
 
E
-
 
T
G
 
G
L
 
K
S
 
L
L
 
L
C
 
T
A
x
S
N
 
N
L
 
I
P
 
P
G
 
A
A
 
A
T
 
M
G
 
G
R
 
H
P
 
T
L
 
L
G
 
Q
A
 
R
D
 
D
L
 
L
A
 
E
R
 
E
R
 
R
L
 
L
G
 
Q
Q
 
R
P
 
P
L
 
V
T
 
K
L
 
I
G
 
E
N
|
N
D
|
D
C
 
A
R
 
N
C
 
C
F
 
F
A
 
A
L
 
L
S
 
S
E
 
E
A
 
A
L
 
W
G
 
D
G
 
E
A
 
D
G
 
L
A
 
R
G
 
G
Y
 
E
R
 
P
R
 
S
V
 
V
F
 
L
G
 
G
A
 
L
V
 
I
L
 
L
G
|
G
T
|
T
G
|
G
A
x
V
A
x
G
G
 
G
G
 
G
L
 
L
V
 
I
V
 
F
D
 
N
G
 
G
L
 
K
L
 
V
Y
 
H
Q
 
S
G
 
G
R
 
R
Q
 
A
D
 
N
I
 
I
A
 
A
C
 
G
E
|
E
Y
 
I
G
 
G
H
|
H
Q
 
T
P
 
R
L
 
L
P
 
P
A
 
Y
-
 
D
-
 
A
-
 
L
R
 
K
L
 
L
L
 
L
L
 
G
R
 
M
Y
 
E
Q
 
N
L
 
A
P
 
P
L
 
I
W
 
F
T
 
P
C
|
C
G
 
G
C
|
C
G
 
K
Q
 
N
Q
 
S
G
 
G
C
|
C
Y
 
I
E
x
D
A
 
N
Y
 
Y
V
 
L
S
 
S
G
 
G
P
 
R
G
 
G
L
 
F
A
 
E
R
 
Q
L
 
L
Y
 
Y
G
 
D
H
 
H
F
 
Y
G
 
F
G
 
S
Q
 
E
A
 
K
E
 
L
D
 
S
A
 
A
A
 
P
A
x
E
V
 
I
L
 
I
A
 
A
L
x
H
W
 
Y
R
 
E
R
 
Q
A
 
G
E
 
E
P
 
R
L
 
R
A
 
A
Q
 
V
A
 
Q
T
 
H
L
 
V
D
 
E
C
 
R
Y
 
F
L
 
M
D
 
E
L
 
L
L
 
L
G
 
A
A
 
I
C
 
C
F
 
L
A
 
A
G
 
N
L
 
I
V
 
F
L
 
T
A
 
C
Y
 
L
D
 
D
P
 
P
D
 
H
L
 
V
I
 
V
V
 
V
L
 
L
G
 
G
G
 
G
G
 
G
L
 
L
S
 
S
K
 
N
V
 
F
P
 
E
E
 
L
L
 
I
Y
 
Y
Q
 
Q
L
 
E
L
 
L
P
 
P
A
 
K
R
 
R
I
 
L
D
 
P
A
 
A
C
 
H
L
 
L
F
 
L
G
 
H
P
 
V
F
 
A
Q
 
K
S
 
L
P
 
P
P
 
K
L
 
I
V
 
I
P
 
K
A
 
A
R
 
R
F
 
H
G
 
G
D
 
D
A
 
A
S
 
G
G
 
G
A
 
V
R
 
R
G
 
G
I
 
A
A
 
A
L
 
F
L
 
L

7p9pAAA Ubiquitin-like protein SMT3,N-acetyl-D-glucosamine kinase
42% identity, 98% coverage: 1:295/300 of query aligns to 3:302/304 of 7p9pAAA

query
sites
7p9pAAA
M
 
M
I
 
Y
Y
 
Y
G
 
G
L
 
F
D
 
D
V
 
I
G
 
G
G
|
G
T
|
T
K
|
K
M
 
I
E
 
E
L
 
F
G
 
G
C
 
A
F
 
F
D
 
D
A
 
A
Q
 
D
L
 
L
N
 
V
D
 
R
L
 
V
E
 
A
R
 
R
C
 
E
R
 
R
V
 
V
A
 
A
T
 
T
P
 
P
A
 
T
R
 
E
D
 
S
Y
 
Y
P
 
A
A
 
A
L
 
F
L
 
L
N
 
D
T
 
A
I
 
I
A
 
V
A
 
T
L
 
L
V
 
V
A
 
N
D
 
N
A
 
A
R
 
D
L
 
A
R
 
E
H
 
F
G
 
G
-
 
V
P
 
K
G
 
G
P
 
T
L
 
V
G
 
G
I
 
I
A
 
G
L
 
I
P
 
P
G
 
G
L
 
I
V
 
A
D
 
D
G
 
V
Q
 
E
-
 
T
G
 
G
L
 
K
S
 
L
L
 
L
C
 
T
A
 
S
N
 
N
L
 
I
P
 
P
G
 
A
A
 
A
T
 
M
G
 
G
R
 
H
P
 
T
L
 
L
G
 
Q
A
 
R
D
 
D
L
 
L
A
 
E
R
 
E
R
 
R
L
 
L
G
 
Q
Q
 
R
P
 
P
L
 
V
T
 
K
L
 
I
G
 
E
N
 
N
D
 
D
C
 
A
R
 
N
C
 
C
F
 
F
A
 
A
L
 
L
S
 
S
E
 
E
A
 
A
L
 
W
G
 
D
G
 
E
A
 
D
G
 
L
A
 
R
G
 
G
Y
 
E
R
 
P
R
 
S
V
 
V
F
 
L
G
 
G
A
 
L
V
 
I
L
 
L
G
|
G
T
|
T
G
 
G
A
 
V
A
 
G
G
 
G
G
 
G
L
 
L
V
 
I
V
 
F
D
 
N
G
 
G
L
 
K
L
 
V
Y
 
H
Q
 
S
G
 
G
R
 
R
Q
 
A
D
 
N
I
 
I
A
 
A
C
 
G
E
 
E
Y
 
I
G
 
G
H
|
H
Q
 
T
P
 
R
L
 
L
P
 
P
A
 
Y
-
 
D
-
 
A
-
 
L
R
 
K
L
 
L
L
 
L
L
 
G
R
 
M
Y
 
E
Q
 
N
L
 
A
P
 
P
L
 
I
W
 
F
T
 
P
C
|
C
G
 
G
C
|
C
G
 
K
Q
 
N
Q
 
S
G
 
G
C
|
C
Y
 
I
E
 
D
A
 
N
Y
 
Y
V
 
L
S
 
S
G
|
G
P
 
R
G
 
G
L
 
F
A
x
E
R
 
Q
L
 
L
Y
 
Y
G
 
D
H
 
H
F
 
Y
G
 
F
G
 
S
Q
 
E
A
 
K
E
 
L
D
 
S
A
|
A
A
 
P
A
x
E
V
 
I
L
 
I
A
 
A
L
x
H
W
 
Y
R
 
E
R
 
Q
A
 
G
E
 
E
P
 
R
L
 
R
A
 
A
Q
 
V
A
 
Q
T
 
H
L
 
V
D
 
E
C
 
R
Y
 
F
L
 
M
D
 
E
L
 
L
L
 
L
G
 
A
A
 
I
C
 
C
F
 
L
A
 
A
G
 
N
L
 
I
V
 
F
L
 
T
A
 
C
Y
 
L
D
 
D
P
 
P
D
 
H
L
 
V
I
 
V
V
 
V
L
 
L
G
 
G
G
|
G
G
|
G
L
 
L
S
 
S
K
x
N
V
 
F
P
 
E
E
 
L
L
 
I
Y
 
Y
Q
 
Q
L
 
E
L
 
L
P
 
P
A
 
K
R
 
R
I
 
L
D
 
P
A
 
A
C
 
H
L
 
L
F
 
L
G
 
H
P
 
V
F
 
A
Q
 
K
S
 
L
P
 
P
P
 
K
L
 
I
V
 
I
P
 
K
A
 
A
R
 
R
F
 
H
G
 
G
D
 
D
A
 
A
S
 
G
G
 
G
A
 
V
R
 
R
G
 
G
I
 
A
A
 
A
L
 
F
L
 
L

4db3A 1.95 angstrom resolution crystal structure of n-acetyl-d-glucosamine kinase from vibrio vulnificus.
39% identity, 98% coverage: 1:295/300 of query aligns to 9:307/311 of 4db3A

query
sites
4db3A
M
 
M
I
 
Y
Y
 
Y
G
 
G
L
 
F
D
 
D
V
 
V
G
 
G
G
 
G
T
 
T
K
 
K
M
 
I
E
 
E
L
 
F
G
 
G
C
 
A
F
 
F
D
 
N
A
 
E
Q
 
K
L
 
L
N
 
E
D
 
R
L
 
V
E
 
A
R
 
T
C
 
E
R
 
R
V
 
V
A
 
P
T
 
T
P
 
P
A
 
T
R
 
D
D
 
D
Y
 
Y
P
 
P
A
 
L
L
 
L
L
 
L
N
 
E
T
 
T
I
 
I
A
 
A
A
 
G
L
 
L
V
 
V
A
 
A
D
 
K
A
 
Y
R
 
D
L
 
Q
R
 
E
H
 
F
G
 
A
-
 
C
P
 
E
G
 
G
P
 
K
L
 
I
G
 
G
I
 
L
A
 
G
L
 
L
P
 
P
G
 
G
L
 
M
V
 
E
D
 
D
G
 
A
Q
 
D
G
 
D
L
 
A
S
 
T
-
 
V
L
 
L
C
 
T
A
 
V
N
 
N
L
 
V
P
 
P
G
 
A
A
 
A
T
 
K
G
 
G
R
 
K
P
 
P
L
 
L
G
 
R
A
 
A
D
 
D
L
 
L
A
 
E
R
 
A
R
 
K
L
 
I
G
 
G
Q
 
R
P
 
S
L
 
V
T
 
K
L
 
I
G
 
E
N
 
N
D
 
D
C
 
A
R
 
N
C
 
C
F
 
F
A
 
A
L
 
L
S
 
S
E
 
E
A
 
A
L
 
W
G
 
D
G
 
E
A
 
E
G
 
L
A
 
Q
G
 
D
Y
 
A
R
 
P
R
 
S
V
 
V
F
 
M
G
 
G
A
 
L
V
 
I
L
 
L
G
 
G
T
 
T
G
 
G
A
 
F
A
 
G
G
 
G
G
 
G
L
 
L
V
 
I
V
 
Y
D
 
E
G
 
G
L
 
K
L
 
V
Y
 
F
Q
 
S
G
 
G
R
 
R
Q
 
N
D
 
N
I
 
V
A
 
A
C
 
G
E
 
E
Y
 
L
G
 
G
H
|
H
Q
 
M
-
 
R
-
 
L
P
 
P
L
 
L
P
 
D
A
 
A
R
 
W
L
 
F
L
 
H
L
 
L
R
 
G
Y
 
D
Q
 
N
L
 
A
P
 
P
L
 
L
W
 
L
T
 
G
C
|
C
G
 
G
C
|
C
G
 
G
Q
 
K
Q
 
K
G
 
G
C
|
C
Y
 
L
E
 
D
A
 
S
Y
 
Y
V
 
L
S
 
S
G
 
G
P
 
R
G
 
G
L
 
F
A
 
E
R
 
L
L
 
L
Y
 
Y
G
 
A
H
 
H
F
 
Y
G
 
Y
G
 
G
Q
 
E
A
 
E
E
 
K
D
 
K
A
 
A
A
 
I
A
 
D
V
 
I
L
 
I
A
 
K
L
 
A
W
 
N
R
 
A
R
 
A
A
 
G
E
 
D
P
 
E
L
 
K
A
 
A
Q
 
A
A
 
E
T
 
H
L
 
V
D
 
E
C
 
R
Y
 
F
L
 
M
D
 
E
L
 
L
L
 
L
G
 
A
A
 
I
C
 
C
F
 
F
A
 
G
G
 
N
L
 
I
V
 
F
L
 
T
A
 
A
Y
 
N
D
 
D
P
 
P
D
 
H
L
 
V
I
 
V
V
 
A
L
 
L
G
 
G
G
 
G
G
 
G
L
 
L
S
 
S
K
 
N
V
 
F
P
 
E
E
 
L
L
 
I
Y
 
Y
Q
 
E
L
 
E
L
 
M
P
 
P
A
 
K
R
 
R
I
 
V
D
 
P
A
 
K
C
 
Y
L
 
L
F
 
L
G
 
S
P
 
V
F
 
A
Q
 
K
S
 
C
P
 
P
P
 
K
L
 
I
V
 
I
P
 
K
A
 
A
R
 
K
F
 
H
G
 
G
D
 
D
A
 
S
S
 
G
G
 
G
A
 
V
R
 
R
G
 
G
I
 
A
A
 
A
L
 
F
L
 
L

2ap1A Crystal structure of the putative regulatory protein
43% identity, 98% coverage: 1:295/300 of query aligns to 3:301/305 of 2ap1A

query
sites
2ap1A
M
 
M
I
 
Y
Y
 
Y
G
 
G
L
 
F
D
 
D
V
 
I
G
 
G
G
 
G
T
 
T
K
 
K
M
 
I
E
 
A
L
 
L
G
 
G
C
 
V
F
 
F
D
 
D
A
 
S
Q
 
T
L
 
R
N
 
R
D
 
L
L
 
Q
E
 
W
R
 
E
C
 
K
R
 
R
V
 
V
A
 
P
T
 
T
P
 
P
A
 
H
R
 
T
D
 
S
Y
 
Y
P
 
S
A
 
A
L
 
F
L
 
L
N
 
D
T
 
A
I
 
V
A
 
C
A
 
E
L
 
L
V
 
V
A
 
E
D
 
E
A
 
A
R
 
D
L
 
Q
R
 
R
H
 
F
G
 
G
-
 
V
P
 
K
G
 
G
P
 
S
L
 
V
G
 
G
I
 
I
A
 
G
L
 
I
P
 
P
G
 
G
L
 
M
V
 
P
D
 
E
G
 
T
Q
 
E
-
 
D
G
 
G
L
 
T
S
 
L
L
 
Y
C
 
A
A
 
A
N
 
N
L
 
V
P
 
P
G
 
A
A
 
A
T
 
S
G
 
G
R
 
K
P
 
P
L
 
L
G
 
R
A
 
A
D
 
D
L
 
L
A
 
S
R
 
A
R
 
R
L
 
L
G
 
D
Q
 
R
P
 
D
L
 
V
T
 
R
L
 
L
G
 
D
N
 
N
D
 
D
C
 
A
R
 
N
C
 
C
F
 
F
A
 
A
L
 
L
S
 
S
E
 
E
A
 
A
L
 
W
G
 
D
G
 
D
A
 
E
G
 
F
A
 
T
G
 
Q
Y
 
Y
R
 
P
R
 
L
V
 
V
F
 
M
G
 
G
A
 
L
V
 
I
L
 
L
G
 
G
T
 
T
G
 
G
A
 
V
A
 
G
G
 
G
G
 
G
L
 
L
V
 
V
V
 
L
D
 
N
G
 
G
L
 
K
L
 
P
Y
 
I
Q
 
T
G
 
G
R
 
Q
Q
 
S
D
 
Y
I
 
I
A
 
T
C
 
G
E
 
E
Y
 
F
G
 
G
H
|
H
Q
 
M
P
 
R
L
 
L
P
 
P
-
 
V
-
 
D
A
 
A
R
 
L
L
 
T
L
 
L
L
 
M
R
 
G
Y
 
F
Q
 
D
L
 
F
P
 
P
L
 
L
W
 
R
T
 
R
C
|
C
G
 
G
C
|
C
G
 
G
Q
 
Q
Q
 
M
G
 
G
C
|
C
Y
 
I
E
 
E
A
 
N
Y
 
Y
V
 
L
S
 
S
G
 
G
P
 
R
G
 
G
L
 
F
A
 
A
R
 
W
L
 
L
Y
 
Y
G
 
Q
H
 
H
F
 
Y
G
 
Y
G
 
D
Q
 
Q
A
 
S
E
 
L
D
 
Q
A
 
A
A
 
P
A
 
E
V
 
I
L
 
I
A
 
A
L
 
L
W
 
W
R
 
E
R
 
Q
A
 
G
E
 
D
P
 
E
L
 
Q
A
 
A
Q
 
H
A
 
A
T
 
H
L
 
V
D
 
E
C
 
R
Y
 
Y
L
 
L
D
 
D
L
 
L
L
 
L
G
 
A
A
 
V
C
 
C
F
 
L
A
 
G
G
 
N
L
 
I
V
 
L
L
 
T
A
 
I
Y
 
V
D
 
D
P
 
P
D
 
D
L
 
L
I
 
L
V
 
V
L
 
I
G
 
G
G
 
G
G
 
G
L
 
L
S
 
S
K
 
N
V
 
F
P
 
T
E
 
A
L
 
I
Y
 
T
Q
 
T
L
 
Q
L
 
L
P
 
A
A
 
E
R
 
R
I
 
L
D
 
P
A
 
R
C
 
H
L
 
L
F
 
L
G
 
P
P
 
V
F
 
A
Q
 
R
S
 
A
P
 
P
P
 
R
L
 
I
V
 
E
P
 
R
A
 
A
R
 
R
F
 
H
G
 
G
D
 
D
A
 
A
S
 
G
G
 
G
A
 
M
R
 
R
G
 
G
I
 
A
A
 
A
L
 
F
L
 
L

Q8ZPZ9 N-acetyl-D-glucosamine kinase; GlcNAc kinase; EC 2.7.1.59 from Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720)
43% identity, 98% coverage: 1:295/300 of query aligns to 1:299/303 of Q8ZPZ9

query
sites
Q8ZPZ9
M
 
M
I
 
Y
Y
 
Y
G
 
G
L
 
F
D
 
D
V
 
I
G
 
G
G
 
G
T
 
T
K
 
K
M
 
I
E
 
A
L
 
L
G
 
G
C
 
V
F
 
F
D
 
D
A
 
S
Q
 
T
L
 
R
N
 
R
D
 
L
L
 
Q
E
 
W
R
 
E
C
 
K
R
 
R
V
 
V
A
 
P
T
 
T
P
 
P
A
 
H
R
 
T
D
 
S
Y
 
Y
P
 
S
A
 
A
L
 
F
L
 
L
N
 
D
T
 
A
I
 
V
A
 
C
A
 
E
L
 
L
V
 
V
A
 
E
D
 
E
A
 
A
R
 
D
L
 
Q
R
 
R
H
 
F
G
 
G
-
 
V
P
 
K
G
 
G
P
 
S
L
 
V
G
 
G
I
 
I
A
 
G
L
 
I
P
 
P
G
 
G
L
 
M
V
 
P
D
 
E
G
 
T
Q
 
E
-
 
D
G
 
G
L
 
T
S
 
L
L
 
Y
C
 
A
A
 
A
N
 
N
L
 
V
P
 
P
G
 
A
A
 
A
T
 
S
G
 
G
R
 
K
P
 
P
L
 
L
G
 
R
A
 
A
D
 
D
L
 
L
A
 
S
R
 
A
R
 
R
L
 
L
G
 
D
Q
 
R
P
 
D
L
 
V
T
 
R
L
 
L
G
 
D
N
 
N
D
 
D
C
 
A
R
 
N
C
 
C
F
 
F
A
 
A
L
 
L
S
 
S
E
 
E
A
 
A
L
 
W
G
 
D
G
 
D
A
 
E
G
 
F
A
 
T
G
 
Q
Y
 
Y
R
 
P
R
 
L
V
 
V
F
 
M
G
 
G
A
 
L
V
 
I
L
 
L
G
 
G
T
 
T
G
 
G
A
 
V
A
 
G
G
 
G
G
 
G
L
 
L
V
 
V
V
 
L
D
 
N
G
 
G
L
 
K
L
 
P
Y
 
I
Q
 
T
G
 
G
R
 
Q
Q
 
S
D
 
Y
I
 
I
A
 
T
C
 
G
E
 
E
Y
 
F
G
 
G
H
|
H
Q
 
M
P
 
R
L
 
L
P
 
P
-
 
V
-
 
D
A
 
A
R
 
L
L
 
T
L
 
L
L
 
M
R
 
G
Y
 
F
Q
 
D
L
 
F
P
 
P
L
 
L
W
 
R
T
 
R
C
|
C
G
 
G
C
|
C
G
 
G
Q
 
Q
Q
 
M
G
 
G
C
|
C
Y
 
I
E
 
E
A
 
N
Y
 
Y
V
 
L
S
 
S
G
 
G
P
 
R
G
 
G
L
 
F
A
 
A
R
 
W
L
 
L
Y
 
Y
G
 
Q
H
 
H
F
 
Y
G
 
Y
G
 
D
Q
 
Q
A
 
S
E
 
L
D
 
Q
A
 
A
A
 
P
A
 
E
V
 
I
L
 
I
A
 
A
L
 
L
W
 
W
R
 
E
R
 
Q
A
 
G
E
 
D
P
 
E
L
 
Q
A
 
A
Q
 
H
A
 
A
T
 
H
L
 
V
D
 
E
C
 
R
Y
 
Y
L
 
L
D
 
D
L
 
L
L
 
L
G
 
A
A
 
V
C
 
C
F
 
L
A
 
G
G
 
N
L
 
I
V
 
L
L
 
T
A
 
I
Y
 
V
D
 
D
P
 
P
D
 
D
L
 
L
I
 
L
V
 
V
L
 
I
G
 
G
G
 
G
G
 
G
L
 
L
S
 
S
K
 
N
V
 
F
P
 
T
E
 
A
L
 
I
Y
 
T
Q
 
T
L
 
Q
L
 
L
P
 
A
A
 
E
R
 
R
I
 
L
D
 
P
A
 
R
C
 
H
L
 
L
F
 
L
G
 
P
P
 
V
F
 
A
Q
 
R
S
 
A
P
 
P
P
 
R
L
 
I
V
 
E
P
 
R
A
 
A
R
 
R
F
 
H
G
 
G
D
 
D
A
 
A
S
 
G
G
 
G
A
 
M
R
 
R
G
 
G
I
 
A
A
 
A
L
 
F
L
 
L

3vglA Crystal structure of a rok family glucokinase from streptomyces griseus in complex with glucose and amppnp (see paper)
32% identity, 99% coverage: 1:298/300 of query aligns to 2:311/312 of 3vglA

query
sites
3vglA
M
 
L
I
 
T
Y
 
I
G
 
G
L
 
V
D
 
D
V
 
I
G
|
G
G
 
G
T
|
T
K
|
K
M
 
I
E
 
A
L
 
A
G
 
G
C
 
V
F
 
V
D
 
D
A
 
E
Q
 
E
L
 
G
N
 
R
D
 
I
L
 
L
E
 
S
R
 
T
C
 
F
R
 
K
V
 
V
A
 
A
T
 
T
P
 
P
A
 
P
R
 
T
D
 
-
Y
 
A
P
 
E
A
 
G
L
 
I
L
 
V
N
 
D
T
 
A
I
 
I
A
 
C
A
 
A
L
 
A
V
 
V
A
 
A
D
 
G
A
 
A
R
 
S
L
 
E
R
 
G
H
 
H
G
 
D
P
 
V
G
 
E
P
 
A
L
 
V
G
 
G
I
 
I
A
 
G
L
 
A
P
 
A
G
|
G
L
 
Y
V
 
V
D
 
D
G
 
D
Q
 
K
G
 
R
L
 
A
S
 
T
-
 
V
L
 
L
C
 
F
A
 
A
N
x
P
L
 
N
P
 
I
G
 
D
A
 
W
T
 
R
G
 
H
R
 
E
P
 
P
L
 
L
G
 
K
A
 
D
D
 
K
L
 
V
A
 
E
R
 
Q
R
 
R
L
 
V
G
 
G
Q
 
L
P
 
P
L
 
V
T
 
V
L
 
V
G
 
E
N
|
N
D
|
D
C
 
A
R
 
N
C
 
A
F
 
A
A
 
A
L
 
W
S
 
G
E
 
E
A
 
Y
L
 
R
G
 
F
G
 
G
A
 
A
G
 
G
A
 
Q
G
 
G
Y
 
H
R
 
D
R
 
D
V
 
V
F
 
I
G
 
C
A
 
I
V
 
T
L
 
L
G
|
G
T
|
T
G
 
G
A
x
L
A
x
G
G
 
G
G
 
G
L
 
I
V
 
I
V
 
I
D
 
G
G
 
N
L
 
K
L
 
L
Y
 
R
Q
 
R
G
 
G
R
 
R
Q
 
F
D
 
G
I
 
V
A
 
A
C
 
A
E
|
E
Y
 
F
G
 
G
H
|
H
-
 
I
Q
 
R
P
 
V
L
 
V
P
 
P
A
 
D
R
 
G
L
 
L
L
 
L
L
 
-
R
 
-
Y
 
-
Q
 
-
L
 
-
P
 
-
L
 
-
W
 
-
T
 
-
C
|
C
G
 
G
C
|
C
G
 
G
Q
 
S
Q
 
Q
G
 
G
C
|
C
Y
 
W
E
|
E
A
 
Q
Y
 
Y
V
 
A
S
 
S
G
|
G
P
 
R
G
 
A
L
 
L
A
 
V
R
 
R
L
 
Y
Y
 
A
G
 
K
H
 
Q
F
 
R
G
 
A
G
 
N
Q
 
A
A
 
T
E
 
P
D
 
E
A
 
N
A
 
A
A
 
A
V
 
V
L
 
L
-
 
L
-
 
G
-
 
L
-
 
G
-
 
D
-
 
G
-
 
S
-
 
V
-
 
D
-
 
G
-
 
I
-
 
E
-
x
G
-
 
K
-
 
H
-
 
I
-
x
S
A
 
E
L
 
A
W
 
A
R
 
R
R
 
Q
A
 
G
E
 
D
P
 
P
L
 
V
A
 
A
Q
 
V
A
 
D
T
 
S
L
 
F
D
 
R
C
 
E
Y
 
L
L
 
A
D
 
R
L
 
W
L
 
A
G
 
G
A
 
A
C
 
G
F
 
L
A
 
A
G
 
D
L
 
L
V
 
A
L
 
S
A
 
L
Y
 
F
D
 
D
P
 
P
D
 
S
L
 
A
I
 
F
V
 
I
L
 
V
G
 
G
G
 
G
G
|
G
L
x
V
S
 
S
K
 
D
V
x
E
P
 
G
E
 
E
L
 
L
Y
 
V
Q
 
-
L
 
L
L
 
D
P
 
P
A
 
I
R
 
R
-
 
K
-
 
S
I
 
F
D
 
R
A
 
R
C
 
W
L
 
L
F
 
I
G
 
G
P
 
G
F
 
E
Q
 
W
S
 
R
P
 
P
-
 
H
-
 
A
P
 
Q
L
 
V
V
 
L
P
 
A
A
 
A
R
 
Q
F
 
L
G
 
G
D
 
G
A
 
K
S
 
A
G
 
G
A
 
L
R
 
V
G
 
G
I
 
A
A
 
A
L
 
D
L
 
L
A
 
A
R
 
R
Q
 
Q

3vgkB Crystal structure of a rok family glucokinase from streptomyces griseus (see paper)
32% identity, 99% coverage: 1:298/300 of query aligns to 2:311/312 of 3vgkB

query
sites
3vgkB
M
 
L
I
 
T
Y
 
I
G
 
G
L
 
V
D
 
D
V
 
I
G
 
G
G
 
G
T
 
T
K
 
K
M
 
I
E
 
A
L
 
A
G
 
G
C
 
V
F
 
V
D
 
D
A
 
E
Q
 
E
L
 
G
N
 
R
D
 
I
L
 
L
E
 
S
R
 
T
C
 
F
R
 
K
V
 
V
A
 
A
T
 
T
P
 
P
A
 
P
R
 
T
D
 
-
Y
 
A
P
 
E
A
 
G
L
 
I
L
 
V
N
 
D
T
 
A
I
 
I
A
 
C
A
 
A
L
 
A
V
 
V
A
 
A
D
 
G
A
 
A
R
 
S
L
 
E
R
 
G
H
 
H
G
 
D
P
 
V
G
 
E
P
 
A
L
 
V
G
 
G
I
 
I
A
 
G
L
 
A
P
 
A
G
 
G
L
 
Y
V
 
V
D
 
D
G
 
D
Q
 
K
G
 
R
L
 
A
S
 
T
-
 
V
L
 
L
C
 
F
A
 
A
N
 
P
L
 
N
P
 
I
G
 
D
A
 
W
T
 
R
G
 
H
R
 
E
P
 
P
L
 
L
G
 
K
A
 
D
D
 
K
L
 
V
A
 
E
R
 
Q
R
 
R
L
 
V
G
 
G
Q
 
L
P
 
P
L
 
V
T
 
V
L
 
V
G
 
E
N
 
N
D
 
D
C
 
A
R
 
N
C
 
A
F
 
A
A
 
A
L
 
W
S
 
G
E
 
E
A
 
Y
L
 
R
G
 
F
G
 
G
A
 
A
G
 
G
A
 
Q
G
 
G
Y
 
H
R
 
D
R
 
D
V
 
V
F
 
I
G
 
C
A
 
I
V
 
T
L
 
L
G
 
G
T
 
T
G
 
G
A
 
L
A
 
G
G
 
G
G
 
G
L
 
I
V
 
I
V
 
I
D
 
G
G
 
N
L
 
K
L
 
L
Y
 
R
Q
 
R
G
 
G
R
 
R
Q
 
F
D
 
G
I
 
V
A
 
A
C
 
A
E
 
E
Y
 
F
G
 
G
H
|
H
-
 
I
Q
 
R
P
 
V
L
 
V
P
 
P
A
 
D
R
 
G
L
 
L
L
 
L
L
 
-
R
 
-
Y
 
-
Q
 
-
L
 
-
P
 
-
L
 
-
W
 
-
T
 
-
C
|
C
G
 
G
C
|
C
G
 
G
Q
 
S
Q
 
Q
G
 
G
C
|
C
Y
 
W
E
 
E
A
 
Q
Y
 
Y
V
 
A
S
 
S
G
 
G
P
 
R
G
 
A
L
 
L
A
 
V
R
 
R
L
 
Y
Y
 
A
G
 
K
H
 
Q
F
 
R
G
 
A
G
 
N
Q
 
A
A
 
T
E
 
P
D
 
E
A
 
N
A
 
A
A
 
A
V
 
V
L
 
L
-
 
L
-
 
G
-
 
L
-
 
G
-
 
D
-
 
G
-
 
S
-
 
V
-
 
D
-
 
G
-
 
I
-
 
E
-
 
G
-
 
K
-
 
H
-
 
I
-
 
S
A
 
E
L
 
A
W
 
A
R
 
R
R
 
Q
A
 
G
E
 
D
P
 
P
L
 
V
A
 
A
Q
 
V
A
 
D
T
 
S
L
 
F
D
 
R
C
 
E
Y
 
L
L
 
A
D
 
R
L
 
W
L
 
A
G
 
G
A
 
A
C
 
G
F
 
L
A
 
A
G
 
D
L
 
L
V
 
A
L
 
S
A
 
L
Y
 
F
D
 
D
P
 
P
D
 
S
L
 
A
I
 
F
V
 
I
L
 
V
G
 
G
G
 
G
G
 
G
L
 
V
S
 
S
K
 
D
V
 
E
P
 
G
E
 
E
L
 
L
Y
 
V
Q
 
-
L
 
L
L
 
D
P
 
P
A
 
I
R
 
R
-
 
K
-
 
S
I
 
F
D
 
R
A
 
R
C
 
W
L
 
L
F
 
I
G
 
G
P
 
G
F
 
E
Q
 
W
S
 
R
P
 
P
-
 
H
-
 
A
P
 
Q
L
 
V
V
 
L
P
 
A
A
 
A
R
 
Q
F
 
L
G
 
G
D
 
G
A
 
K
S
 
A
G
 
G
A
 
L
R
 
V
G
 
G
I
 
A
A
 
A
L
 
D
L
 
L
A
 
A
R
 
R
Q
 
Q

2qm1B Crystal structure of glucokinase from enterococcus faecalis
26% identity, 99% coverage: 2:298/300 of query aligns to 8:321/325 of 2qm1B

query
sites
2qm1B
I
 
I
Y
 
I
G
 
G
L
 
I
D
 
D
V
 
L
G
 
G
G
 
G
T
 
T
K
 
T
M
 
I
E
 
K
L
 
F
G
 
A
C
 
I
F
 
L
D
 
T
A
 
T
-
 
D
-
 
G
-
 
V
-
 
V
-
 
Q
Q
 
Q
L
 
K
N
 
W
D
 
S
L
 
I
E
 
E
R
 
T
C
 
N
R
 
I
V
 
L
A
 
E
T
 
D
P
 
G
A
 
K
R
 
H
D
 
I
Y
 
V
P
 
P
A
 
S
L
 
I
L
 
I
N
 
E
T
 
S
I
 
I
A
 
R
A
 
H
L
 
R
V
 
I
A
 
D
D
 
L
A
 
Y
R
 
N
L
 
M
R
 
K
H
 
K
G
 
E
P
 
D
G
 
F
P
 
V
-
 
G
L
 
I
G
 
G
I
 
M
A
 
G
L
 
T
P
 
P
G
 
G
L
 
S
V
 
V
D
 
D
G
 
I
Q
 
E
G
 
K
L
 
G
S
 
T
L
 
V
C
 
V
A
 
G
-
 
A
-
 
Y
N
 
N
L
 
L
P
 
N
G
 
W
A
 
T
T
 
T
G
 
V
R
 
Q
P
 
P
L
 
V
G
 
K
A
 
E
D
 
Q
L
 
I
A
 
E
R
 
S
R
 
A
L
 
L
G
 
G
Q
 
I
P
 
P
L
 
F
T
 
A
L
 
L
G
 
D
N
|
N
D
 
D
C
 
A
R
x
N
C
 
V
F
 
A
A
 
A
L
 
L
S
 
G
E
 
E
A
 
R
L
 
W
G
 
K
G
 
G
A
 
A
G
 
G
A
 
E
G
 
N
Y
 
N
R
 
P
R
 
D
V
 
V
F
 
I
G
 
F
A
 
I
V
 
T
L
 
L
G
 
G
T
 
T
G
 
G
A
 
V
A
 
G
G
|
G
G
 
G
L
 
I
V
 
V
V
 
A
D
 
A
G
 
G
L
 
K
L
 
L
Y
 
L
Q
 
H
G
 
G
R
 
V
Q
 
A
D
 
G
I
 
C
A
 
A
C
 
G
E
 
E
Y
 
V
G
 
G
H
|
H
Q
 
V
P
 
T
L
 
V
P
 
D
A
 
P
R
 
N
L
 
G
L
 
-
L
 
-
R
 
-
Y
 
-
Q
 
-
L
 
-
P
 
-
L
 
-
W
 
F
T
 
D
C
|
C
G
 
T
C
|
C
G
 
G
Q
 
K
Q
 
R
G
 
G
C
|
C
Y
 
L
E
 
E
A
 
T
Y
 
V
V
 
S
S
 
S
G
 
A
P
 
T
G
 
G
L
 
V
A
 
V
R
 
R
L
 
V
Y
 
A
G
 
R
H
 
H
-
 
L
-
 
S
-
 
E
-
 
E
F
 
F
G
 
A
G
 
G
Q
 
D
A
 
S
E
 
E
-
 
L
-
 
K
-
 
Q
-
 
A
-
 
I
-
 
D
-
 
D
-
 
G
-
 
Q
-
 
D
-
 
V
D
 
S
A
 
S
A
 
K
A
 
D
V
 
V
L
 
F
A
 
E
L
 
F
W
 
A
R
 
E
R
 
K
A
 
G
E
 
D
P
 
H
L
 
F
A
 
A
Q
 
L
A
 
M
T
 
V
L
 
V
D
 
D
C
 
R
Y
 
V
L
 
C
D
 
F
L
 
Y
L
 
L
G
 
G
A
 
L
C
 
A
F
 
T
A
 
G
G
 
N
L
 
L
V
 
G
L
 
N
A
 
T
Y
 
L
D
 
N
P
 
P
D
 
D
L
 
S
I
 
V
V
 
V
L
 
I
G
 
G
G
 
G
G
 
G
L
 
V
S
 
S
K
 
A
V
 
A
P
 
G
E
 
E
L
 
-
Y
 
-
Q
 
-
L
 
F
L
 
L
P
 
R
A
 
S
R
 
R
I
 
V
D
 
E
A
 
K
C
 
-
L
 
Y
F
 
F
G
 
Q
P
 
E
F
 
F
-
 
T
-
 
F
-
 
P
-
 
Q
-
 
V
-
 
R
Q
 
N
S
 
S
P
 
T
P
 
K
L
 
I
V
 
K
P
 
L
A
 
A
R
 
E
F
 
L
G
 
G
D
 
N
A
 
E
S
 
A
G
 
G
A
 
V
R
 
I
G
 
G
I
 
A
A
 
A
L
 
S
L
 
L
A
 
A
R
 
L
Q
 
Q

6jdbA Crystal structure of n-acetyl mannosmaine kinase in complex with mannac-6p and adp from haemophilus influenzae
25% identity, 89% coverage: 5:271/300 of query aligns to 6:273/290 of 6jdbA

query
sites
6jdbA
L
 
L
D
 
D
V
 
I
G
 
G
G
 
G
T
 
T
K
|
K
M
 
I
E
 
A
L
 
A
G
 
A
C
 
I
F
 
V
D
 
K
A
 
N
Q
 
E
L
 
I
N
 
E
D
 
-
L
 
-
E
 
Q
R
 
R
C
 
Q
R
 
Q
V
 
I
A
 
H
T
 
T
P
 
P
A
 
R
R
 
E
D
 
N
Y
 
V
-
 
V
P
 
E
A
 
G
L
 
M
L
 
H
N
 
Q
T
 
A
I
 
L
A
 
G
A
 
K
L
 
L
V
 
L
A
 
A
D
 
D
A
 
Y
R
 
E
L
 
G
R
 
Q
H
 
F
G
 
D
P
 
Y
G
 
-
P
 
-
L
 
V
G
 
A
I
 
V
A
 
A
L
 
S
P
x
T
G
|
G
L
 
I
V
 
I
D
 
N
G
 
N
Q
 
G
G
 
I
L
 
L
S
 
S
L
x
A
C
x
L
-
x
N
-
 
P
A
 
K
N
|
N
L
 
L
P
 
G
G
 
G
A
 
L
T
 
A
G
 
E
R
 
F
P
 
P
L
 
L
G
 
K
A
 
A
D
 
S
L
 
I
A
 
A
R
 
K
R
 
H
L
 
T
G
 
D
Q
 
K
P
 
P
L
 
I
T
 
G
L
 
L
G
 
L
N
|
N
D
|
D
C
 
A
R
 
Q
C
 
A
F
 
A
A
 
T
L
 
Y
S
 
A
E
 
E
A
 
Y
L
 
Q
G
 
L
G
 
Q
A
 
N
G
 
F
A
 
E
G
 
Q
Y
 
V
R
 
S
R
 
N
V
 
F
F
 
V
G
 
F
A
 
I
V
 
T
L
 
V
G
x
S
T
|
T
G
 
G
A
 
V
A
 
G
G
 
G
G
 
G
L
 
I
V
 
V
V
 
L
D
 
N
G
 
Q
L
 
I
L
 
L
Y
 
Q
Q
 
T
G
 
G
R
 
S
Q
 
R
D
 
G
I
 
I
A
 
A
C
 
G
E
x
H
Y
 
I
G
 
G
H
|
H
Q
 
T
P
 
L
L
 
A
P
 
D
A
 
P
R
 
N
L
 
G
L
 
A
L
 
I
R
 
-
Y
 
-
Q
 
-
L
 
-
P
 
-
L
 
-
W
 
-
T
 
-
C
|
C
G
 
G
C
|
C
G
 
G
Q
 
R
Q
 
R
G
 
G
C
|
C
Y
 
V
E
|
E
A
 
A
Y
 
I
V
 
A
S
 
S
G
 
G
P
 
R
G
 
A
L
 
I
A
 
E
R
 
A
L
 
V
Y
 
S
G
 
S
H
 
Q
F
 
W
G
 
E
G
 
D
Q
 
P
A
 
C
E
 
-
D
 
D
A
x
P
A
x
K
A
 
E
V
 
V
L
 
F
A
 
E
L
 
R
W
 
F
R
 
R
R
 
K
A
 
N
E
 
D
P
 
E
L
 
K
A
 
A
Q
 
T
A
 
A
T
 
L
L
 
V
D
 
E
C
 
R
Y
 
S
L
 
A
D
 
K
L
 
A
L
 
I
G
 
A
A
 
N
C
 
L
F
 
I
A
 
A
G
 
D
L
 
L
V
 
V
L
 
I
A
 
S
Y
 
L
D
 
D
P
 
I
D
 
Q
L
 
K
I
 
I
V
 
A
L
 
I
G
 
G
G
 
G
G
x
S
-
 
V
-
 
G
-
 
L
-
 
A
-
 
E
-
 
G
-
 
Y
L
 
L
S
 
S
K
 
L
V
 
V
P
 
E
E
 
K
L
 
Y
Y
 
L
Q
 
Q
L
 
D
L
 
F
P
 
P
A
 
S
-
 
I
-
 
Y
-
 
C
-
 
C
R
 
E
I
 
I
D
 
E
A
 
T
C
 
A
L
 
K
F
 
F
G
 
G

3vovB Crystal structure of rok hexokinase from thermus thermophilus (see paper)
30% identity, 98% coverage: 2:296/300 of query aligns to 3:291/298 of 3vovB

query
sites
3vovB
I
 
V
Y
 
V
G
 
G
L
 
L
D
 
D
V
 
L
G
 
G
G
 
G
T
 
T
K
 
K
M
 
I
E
 
A
L
 
A
G
 
G
C
 
V
F
 
F
D
 
D
A
 
G
Q
 
K
L
 
-
N
 
R
D
 
L
L
 
L
E
 
S
R
 
K
C
 
V
R
 
V
V
 
V
A
 
P
T
 
T
P
 
P
A
 
K
R
 
E
D
 
G
Y
 
G
P
 
E
A
 
R
L
 
V
L
 
A
N
 
E
T
 
A
I
 
L
A
 
A
A
 
E
L
 
A
V
 
A
A
 
E
D
 
R
A
 
A
R
 
E
L
 
R
R
 
E
H
 
A
G
 
G
P
 
V
-
 
R
-
 
G
G
 
E
P
 
A
L
 
I
G
 
G
I
 
L
A
 
G
L
 
T
P
 
P
G
 
G
L
 
P
V
 
L
D
 
D
G
 
F
Q
 
R
G
 
R
L
 
G
S
 
V
L
 
I
C
 
R
A
 
P
N
 
N
L
 
I
P
 
P
G
 
G
A
 
V
T
 
Q
G
 
D
R
 
F
P
 
P
L
 
I
G
 
R
A
 
R
D
 
I
L
 
L
A
 
E
R
 
E
R
 
A
L
 
T
G
 
G
Q
 
R
P
 
P
L
 
V
T
 
F
L
 
L
G
 
E
N
 
N
D
 
D
C
 
A
R
 
N
C
 
A
F
 
A
A
 
A
L
 
L
S
 
A
E
 
E
A
 
H
L
 
H
G
 
L
G
 
G
A
 
A
G
 
A
A
 
Q
G
 
G
Y
 
E
R
 
E
R
 
S
V
 
S
F
 
L
G
 
Y
A
 
L
V
 
T
L
 
V
G
 
S
T
 
T
G
 
G
A
 
I
A
 
G
G
 
G
G
 
G
L
 
V
V
 
V
V
 
L
D
 
G
G
 
G
L
 
R
L
 
V
Y
 
L
Q
 
R
G
 
G
R
 
E
Q
 
R
D
 
G
I
 
Q
A
 
G
C
 
G
E
 
E
Y
 
L
G
 
G
H
|
H
Q
 
L
P
 
T
L
 
L
-
 
L
-
 
P
-
 
G
-
 
G
P
 
P
A
 
A
R
 
-
L
 
-
L
 
-
L
 
-
R
 
-
Y
 
-
Q
 
-
L
 
-
P
 
-
L
 
-
W
 
-
T
 
-
C
|
C
G
 
G
C
|
C
G
 
G
Q
 
L
Q
 
E
G
 
G
C
|
C
Y
 
L
E
 
E
A
 
A
Y
 
L
V
 
A
S
 
A
G
 
G
P
 
R
G
 
A
L
 
L
A
 
E
R
 
R
L
 
D
Y
 
A
G
 
T
H
 
Y
F
 
A
G
 
F
G
 
Q
Q
 
R
A
 
P
E
 
V
D
 
D
A
 
T
A
 
R
A
 
E
V
 
L
L
 
F
A
 
R
L
 
L
W
 
F
R
 
Q
R
 
A
A
 
G
E
 
D
P
 
P
L
 
K
A
 
A
Q
 
E
A
 
R
T
 
L
L
 
V
D
 
L
C
 
Q
Y
 
A
L
 
A
D
 
R
L
 
Y
L
 
V
G
 
G
A
 
I
C
 
G
F
 
L
A
 
A
G
 
S
L
 
L
V
 
V
L
 
K
A
 
A
Y
 
F
D
 
D
P
 
P
D
 
G
L
 
V
I
 
V
V
 
V
L
 
L
G
 
G
G
 
G
G
 
G
L
 
V
S
 
A
-
 
L
K
 
N
V
 
A
P
 
P
E
 
E
L
 
G
Y
 
Y
Q
 
W
L
 
E
L
 
A
P
 
L
A
 
L
R
 
E
I
 
A
D
 
Y
A
 
R
C
 
R
L
 
Y
F
 
L
G
 
Q
P
 
G
F
 
W
Q
 
E
S
 
A
P
 
P
P
 
P
L
 
L
V
 
R
P
 
R
A
 
A
R
 
R
F
 
L
G
 
G
D
 
A
A
 
E
S
 
A
G
 
G
A
 
L
R
 
L
G
 
G
I
 
A
A
 
A
L
 
L
L
 
T
A
 
A

P32718 D-allose kinase; Allokinase; EC 2.7.1.55 from Escherichia coli (strain K12) (see paper)
27% identity, 99% coverage: 1:298/300 of query aligns to 7:298/309 of P32718

query
sites
P32718
M
 
V
I
 
V
Y
 
A
G
 
G
L
 
V
D
 
D
V
 
M
G
 
G
G
 
A
T
 
T
K
 
H
M
 
I
E
 
R
L
 
F
G
 
C
C
 
L
F
 
R
D
 
T
A
 
A
Q
 
E
L
 
G
N
 
E
D
 
T
L
 
L
E
 
H
R
 
C
C
 
E
R
 
K
V
 
K
A
 
R
T
 
T
P
 
A
A
 
E
R
 
V
D
 
I
Y
 
A
P
 
P
A
 
G
L
 
L
L
 
V
N
 
S
T
 
G
I
 
I
A
 
G
A
 
E
L
 
M
V
 
I
A
 
-
D
 
D
A
 
E
R
 
Q
L
 
L
R
 
R
-
 
R
-
 
F
-
 
N
-
 
A
-
 
R
-
 
C
H
 
H
G
 
G
P
 
-
G
 
-
P
 
-
L
 
L
G
 
V
I
 
M
A
 
G
L
 
F
P
 
P
G
x
A
L
 
L
V
 
V
-
 
S
-
 
K
D
 
D
G
 
K
Q
 
R
G
 
T
L
 
I
S
 
I
L
 
S
C
 
T
A
 
P
N
 
N
L
 
L
P
 
P
-
 
L
-
 
T
G
 
A
A
 
A
T
 
D
G
 
L
R
 
Y
P
 
D
L
 
L
G
 
A
A
 
D
D
 
K
L
 
L
A
 
E
R
 
N
R
 
T
L
 
L
G
 
N
Q
 
C
P
 
P
L
 
V
T
 
E
L
 
F
G
 
S
N
 
R
D
 
D
C
 
V
R
 
N
C
 
-
F
 
L
A
 
Q
L
 
L
S
 
S
E
 
W
A
 
D
L
 
V
G
 
V
G
 
E
A
 
N
G
 
R
A
 
L
G
 
T
Y
 
Q
R
 
Q
R
 
L
V
 
V
F
 
L
G
 
A
A
 
A
V
 
Y
L
 
L
G
 
G
T
 
T
G
 
G
A
 
M
A
 
G
G
x
F
G
 
A
L
 
V
V
 
W
V
 
M
D
 
N
G
 
G
L
 
A
L
 
P
Y
 
W
Q
 
T
G
 
G
R
 
A
Q
 
H
D
 
G
I
 
V
A
 
A
C
 
G
E
 
E
Y
 
L
G
 
G
H
 
H
Q
 
I
P
 
P
L
 
L
P
 
G
A
 
D
R
 
M
L
 
T
L
 
Q
L
 
-
R
 
-
Y
 
-
Q
 
-
L
 
-
P
 
-
L
 
-
W
 
-
T
 
H
C
 
C
G
 
A
C
 
C
G
 
G
Q
 
N
Q
 
P
G
 
G
C
 
C
Y
 
L
E
 
E
A
 
T
Y
 
N
V
 
C
S
 
S
G
 
G
P
 
M
G
 
A
L
 
L
A
 
R
R
 
R
L
 
W
Y
 
Y
G
 
-
H
 
-
F
 
-
G
 
-
G
 
E
Q
 
Q
A
 
Q
E
 
P
D
 
R
A
 
N
A
 
Y
A
 
P
V
 
L
L
 
R
A
 
D
L
 
L
W
 
F
R
 
V
R
 
H
A
 
A
E
 
E
-
 
N
-
 
A
P
 
P
L
 
F
A
 
V
Q
 
Q
A
 
S
T
 
L
L
 
L
D
 
E
C
 
N
Y
 
-
L
 
-
D
 
-
L
 
-
L
 
A
G
 
A
A
 
R
C
 
A
F
 
I
A
 
A
G
 
T
L
 
S
V
 
I
L
 
N
A
 
L
Y
 
F
D
 
D
P
 
P
D
 
D
L
 
A
I
 
V
V
 
I
L
 
L
G
 
G
G
 
G
G
 
G
L
 
V
S
 
M
K
 
D
V
 
M
P
 
P
E
 
A
L
 
F
-
 
P
Y
 
R
Q
 
E
L
 
T
L
 
L
P
 
V
A
 
A
R
 
M
I
 
T
D
 
Q
A
 
K
C
 
Y
L
 
L
F
 
R
G
 
R
P
 
P
F
 
L
-
 
P
-
 
H
Q
 
Q
S
 
V
P
 
V
P
 
R
L
 
F
V
 
I
P
 
A
A
 
A
R
 
S
F
 
S
G
 
S
D
 
D
A
 
F
S
 
N
G
 
G
A
 
A
R
 
Q
G
 
G
I
 
A
A
 
A
L
 
I
L
 
L
A
 
A
R
 
H
Q
 
Q

3lm9A Crystal structure of fructokinase with adp and fructose bound in the active site (see paper)
24% identity, 99% coverage: 1:298/300 of query aligns to 2:287/294 of 3lm9A

query
sites
3lm9A
M
 
M
I
 
L
Y
 
G
G
 
G
L
 
I
D
 
E
V
 
A
G
 
G
G
 
G
T
 
T
K
 
K
M
 
F
-
 
V
-
 
C
E
 
A
L
 
V
G
 
G
C
 
R
F
 
E
D
 
D
A
 
G
Q
 
T
L
 
I
N
 
I
D
 
D
L
 
-
E
 
-
R
 
-
C
 
-
R
 
R
V
 
I
A
 
E
T
 
F
P
 
P
A
 
T
R
 
K
D
 
M
Y
 
P
P
 
D
A
 
E
L
 
T
L
 
I
N
 
E
T
 
K
I
 
V
A
 
I
A
 
Q
L
 
Y
V
 
F
A
 
S
D
 
Q
A
 
F
R
 
S
L
 
L
R
 
Q
H
 
-
G
 
-
P
 
-
G
 
-
P
 
A
L
 
I
G
 
G
I
 
I
A
 
G
L
 
S
P
 
F
G
|
G
L
 
P
V
 
V
D
 
D
G
 
N
Q
 
D
G
 
K
L
 
T
S
 
S
L
 
Q
C
 
T
A
 
Y
N
 
G
L
 
T
P
 
I
G
 
T
A
 
A
T
 
T
G
 
P
R
 
K
-
 
A
-
 
G
-
 
W
-
 
R
-
 
H
-
 
Y
P
 
P
L
 
F
G
 
L
A
 
Q
D
 
T
L
 
V
A
 
K
R
 
N
R
 
E
L
 
M
G
 
K
Q
 
I
P
 
P
L
 
V
T
 
G
L
 
F
G
 
S
N
 
T
D
|
D
C
 
V
R
 
N
C
 
A
F
 
A
A
 
A
L
 
L
S
 
G
E
 
E
A
 
F
L
 
L
G
 
F
G
 
G
A
 
E
G
 
A
A
 
K
G
 
G
Y
 
L
R
 
D
R
 
S
V
 
C
F
 
L
G
 
Y
A
 
I
V
 
T
L
 
I
G
|
G
T
|
T
G
 
G
A
x
I
A
 
G
G
 
A
G
 
G
L
 
A
V
 
I
V
 
V
D
 
E
G
 
G
L
 
R
L
 
L
Y
 
L
Q
 
Q
G
 
G
R
 
-
Q
 
-
D
 
-
I
 
-
A
 
-
C
 
-
E
 
-
Y
 
L
G
 
S
H
 
H
Q
 
P
P
x
E
L
 
M
P
 
G
A
x
H
R
 
I
L
 
Y
L
 
I
L
 
R
R
 
R
Y
 
H
Q
 
P
L
 
D
P
 
D
L
 
V
W
 
Y
T
 
Q
C
 
G
G
 
K
C
|
C
G
 
P
Q
 
Y
Q
x
H
G
 
G
-
 
D
C
|
C
Y
 
F
E
|
E
A
 
G
Y
 
L
V
 
A
S
 
S
G
|
G
P
|
P
G
 
A
L
 
I
A
x
E
R
 
-
L
 
-
Y
 
-
G
 
A
H
 
R
F
 
W
G
 
G
G
 
K
Q
 
K
A
|
A
E
 
A
D
 
D
A
 
L
A
 
S
A
 
D
V
 
I
L
 
A
A
 
Q
L
 
V
W
 
W
R
 
E
R
 
-
A
 
-
E
 
-
P
 
-
L
 
-
A
 
-
Q
 
-
A
 
-
T
 
-
L
 
L
D
 
E
C
 
G
Y
 
Y
L
 
-
D
 
-
L
 
Y
L
 
I
G
 
A
A
 
Q
C
 
A
F
 
L
A
 
A
G
 
Q
L
 
Y
V
 
I
L
 
L
A
 
I
Y
 
L
D
 
A
P
 
P
D
 
K
L
 
K
I
 
I
V
 
I
L
 
L
G
 
G
G
 
G
G
|
G
L
 
V
S
 
M
K
 
Q
V
 
Q
P
 
K
E
 
Q
-
 
V
-
 
F
-
 
S
-
 
Y
L
 
I
Y
 
Y
Q
 
Q
L
 
Y
L
 
V
P
 
P
A
 
K
R
 
I
I
 
M
D
 
N
A
 
S
C
 
Y
L
 
L
-
 
D
F
 
F
G
 
S
P
 
E
F
 
L
Q
 
S
-
 
D
-
 
D
-
 
I
S
 
S
P
 
D
P
 
Y
L
 
I
V
 
V
P
 
P
A
 
P
R
 
R
F
 
L
G
 
G
D
 
S
A
 
N
S
 
A
G
 
G
A
 
I
R
 
I
G
 
G
I
 
T
A
 
L
L
 
V
L
 
L
A
 
A
R
 
H
Q
 
Q

1z05A Crystal structure of the rok family transcriptional regulator, homolog of e.Coli mlc protein.
26% identity, 80% coverage: 59:297/300 of query aligns to 139:382/396 of 1z05A

query
sites
1z05A
L
 
I
G
 
A
I
 
I
A
 
T
L
 
L
P
 
P
G
 
G
L
 
L
V
 
V
D
 
N
G
 
S
-
 
E
Q
 
Q
G
 
G
L
 
I
S
 
V
L
 
L
C
 
Q
A
 
M
N
 
P
L
 
H
P
 
Y
G
 
N
A
 
V
T
 
K
G
 
N
R
 
L
P
 
A
L
 
L
G
 
G
A
 
P
D
 
E
L
 
I
A
 
Y
R
 
K
R
 
A
L
 
T
G
 
G
Q
 
L
P
 
P
L
 
V
T
 
F
L
 
V
G
 
A
N
 
N
D
 
D
C
 
T
R
 
R
C
 
A
F
 
W
A
 
A
L
 
L
S
 
A
E
 
E
A
 
K
L
 
L
G
 
F
G
 
G
A
 
H
G
 
S
A
 
Q
G
 
D
Y
 
V
R
 
D
R
 
N
V
 
S
F
 
V
G
 
L
A
 
I
V
 
S
L
 
I
G
 
H
T
 
H
G
 
G
A
 
L
A
 
G
G
 
A
G
 
G
L
 
I
V
 
V
V
 
L
D
 
D
G
 
G
L
 
R
L
 
V
Y
 
L
Q
 
Q
G
 
G
R
 
R
Q
 
H
D
 
G
I
 
N
A
 
I
C
 
G
E
 
E
Y
 
L
G
 
G
H
|
H
-
 
I
-
 
Q
-
 
I
Q
 
D
P
 
P
L
 
Q
P
 
G
A
 
K
R
 
R
L
 
-
L
 
-
L
 
-
R
 
-
Y
 
-
Q
 
-
L
 
-
P
 
-
L
 
-
W
 
-
T
 
-
C
|
C
G
 
H
C
|
C
G
 
G
Q
 
N
Q
 
Y
G
 
G
C
|
C
Y
 
L
E
 
E
A
 
T
Y
 
V
V
 
A
S
 
S
G
 
S
P
 
Q
G
 
A
L
 
I
-
 
R
-
 
D
-
 
Q
-
 
V
-
 
T
A
 
A
R
 
R
L
 
I
Y
 
Q
G
 
-
H
 
-
F
 
-
G
 
A
G
 
G
Q
 
E
A
 
P
E
 
S
D
 
C
A
 
L
A
 
A
A
 
T
V
 
V
L
 
E
A
 
E
L
 
I
W
 
S
R
 
I
R
 
E
-
 
D
-
 
I
-
 
C
-
 
A
-
 
A
-
 
A
-
 
A
-
 
D
A
 
G
E
 
D
P
 
P
L
 
L
A
 
A
Q
 
V
A
 
D
T
 
V
L
 
I
D
 
Q
C
 
Q
Y
 
L
L
 
G
D
 
R
L
 
Y
L
 
L
G
 
G
A
 
A
C
 
A
F
 
I
A
 
A
G
 
I
L
 
V
V
 
I
L
 
N
A
 
L
Y
 
F
D
 
N
P
 
P
D
 
E
L
 
K
I
 
I
V
 
L
L
 
I
G
 
G
G
 
G
G
 
V
L
 
I
S
 
N
K
 
Q
V
 
A
P
 
K
E
 
S
L
 
I
Y
 
-
Q
 
-
L
 
L
L
 
Y
P
 
P
A
 
S
R
 
-
I
 
I
D
 
E
A
 
Q
C
 
C
L
 
I
F
 
R
G
 
E
P
 
Q
-
 
S
-
 
L
-
 
P
-
 
V
-
 
Y
F
 
H
Q
 
Q
S
 
D
P
 
L
P
 
K
L
 
L
V
 
V
P
 
E
A
 
S
R
 
R
F
 
F
G
 
Y
D
 
K
A
 
Q
S
 
A
G
 
T
A
 
M
R
 
P
G
 
G
I
 
A
A
 
A
L
 
L
L
 
I
A
 
K
R
 
Q

1z6rA Crystal structure of mlc from escherichia coli (see paper)
24% identity, 78% coverage: 34:268/300 of query aligns to 95:335/382 of 1z6rA

query
sites
1z6rA
R
 
K
D
 
D
Y
 
D
P
 
L
A
 
P
L
 
L
L
 
L
N
 
D
T
 
R
I
 
I
A
 
I
A
 
S
L
 
H
V
 
I
A
 
D
D
 
Q
A
 
F
R
 
F
L
 
I
R
 
R
H
 
H
G
 
Q
P
 
K
G
 
K
-
 
L
-
 
E
-
 
R
-
 
L
-
 
T
P
 
S
L
 
I
G
 
A
I
 
I
A
 
T
L
 
L
P
 
P
G
 
G
L
 
I
V
 
I
D
 
D
G
 
T
Q
 
E
G
 
N
L
 
-
S
 
G
L
 
I
C
 
V
A
 
H
N
 
R
L
 
M
P
 
P
-
 
F
-
 
Y
-
 
E
G
 
D
A
 
V
T
 
K
G
 
E
R
 
M
P
 
P
L
 
L
G
 
G
A
 
E
D
 
A
L
 
L
A
 
E
R
 
Q
R
 
H
L
 
T
G
 
G
Q
 
V
P
 
P
L
 
V
T
 
Y
L
 
I
G
 
Q
N
 
H
D
 
D
C
 
I
R
 
S
C
 
A
F
 
W
A
 
T
L
 
M
S
 
A
E
 
E
A
 
A
L
 
L
G
 
F
G
 
G
A
 
A
G
 
S
A
 
R
G
 
G
Y
 
A
R
 
R
R
 
D
V
 
V
F
 
I
G
 
Q
A
 
V
V
 
V
L
 
I
G
 
D
T
 
H
G
 
N
A
 
V
A
 
G
G
 
A
G
 
G
L
 
V
V
 
I
V
 
T
D
 
D
G
 
G
L
 
H
L
 
L
Y
 
L
Q
 
H
G
 
A
R
 
G
Q
 
S
D
 
S
I
 
S
A
 
L
C
 
V
E
 
E
Y
 
I
G
 
G
H
|
H
-
 
T
-
 
Q
-
 
V
Q
 
D
P
 
P
L
 
Y
P
 
G
A
 
K
R
 
R
L
 
-
L
 
-
L
 
-
R
 
-
Y
 
-
Q
 
-
L
 
-
P
 
-
L
 
-
W
 
-
T
 
-
C
|
C
G
 
Y
C
|
C
G
 
G
Q
 
N
Q
 
H
G
 
G
C
|
C
Y
 
L
E
 
E
A
 
T
Y
 
I
V
 
A
S
 
S
G
 
V
P
 
D
G
 
S
L
 
I
A
 
L
R
 
E
L
 
L
-
 
A
-
 
Q
-
 
L
-
 
R
-
 
L
-
 
N
-
 
Q
-
 
S
-
 
M
Y
 
S
G
 
S
H
 
M
F
 
L
G
 
H
G
 
G
Q
 
Q
A
 
P
E
 
L
D
 
T
A
 
V
A
 
D
A
 
S
V
 
L
L
 
C
A
 
Q
L
 
A
W
 
A
R
 
L
R
 
R
A
 
G
E
 
D
P
 
L
L
 
L
A
 
A
Q
 
K
A
 
D
T
 
I
L
 
I
D
 
T
C
 
G
Y
 
V
L
 
G
D
 
A
L
 
H
L
 
V
G
 
G
A
 
R
C
 
I
F
 
L
A
 
A
G
 
I
L
 
M
V
 
V
L
 
N
A
 
L
Y
 
F
D
 
N
P
 
P
D
 
Q
L
 
K
I
 
I
V
 
L
L
 
I
G
 
G
G
 
S
G
 
P
L
 
L
S
 
S
K
 
K
V
 
A
P
 
A
E
 
D
L
 
I
Y
 
-
Q
 
-
L
 
L
L
 
F
P
 
P
A
 
V
R
 
I
I
 
S
D
 
D
A
 
S
C
 
I

1xc3A Structure of a putative fructokinase from bacillus subtilis (see paper)
24% identity, 99% coverage: 1:298/300 of query aligns to 2:287/295 of 1xc3A

query
sites
1xc3A
M
 
M
I
 
L
Y
 
G
G
 
G
L
 
I
D
 
E
V
 
A
G
 
G
G
 
G
T
 
T
K
 
K
M
 
F
-
 
V
-
 
C
E
 
A
L
 
V
G
 
G
C
 
R
F
 
E
D
 
D
A
 
G
Q
 
T
L
 
I
N
 
I
D
 
D
L
 
-
E
 
-
R
 
-
C
 
-
R
 
R
V
 
I
A
 
E
T
 
F
P
 
P
A
 
T
R
 
K
D
 
M
Y
 
P
P
 
D
A
 
E
L
 
T
L
 
I
N
 
E
T
 
K
I
 
V
A
 
I
A
 
Q
L
 
Y
V
 
F
A
 
S
D
 
Q