SitesBLAST – Find functional sites

 

SitesBLAST

Comparing Echvi_3894 FitnessBrowser__Cola:Echvi_3894 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

5f7rA Rok repressor lmo0178 from listeria monocytogenes bound to inducer (see paper)
27% identity, 88% coverage: 24:280/291 of query aligns to 21:301/306 of 5f7rA

query
sites
5f7rA
D
 
N
G
 
A
E
 
E
L
 
I
I
 
I
E
 
E
K
 
N
R
 
T
E
 
S
I
 
I
P
 
P
T
 
F
P
 
S
S
 
S
Q
 
E
-
 
K
-
 
K
-
 
P
-
 
E
E
 
E
P
 
A
Q
 
I
E
 
E
V
 
L
I
 
I
L
 
A
S
 
K
T
 
N
I
 
V
A
 
K
D
 
K
F
 
M
I
 
C
A
 
G
S
 
N
Y
 
R
F
 
D
S
 
M
H
 
N
E
 
H
I
 
L
D
 
L
G
 
G
I
 
V
G
 
G
I
 
I
G
 
A
I
 
I
P
 
S
G
|
G
L
 
L
V
 
V
D
 
N
A
 
R
E
 
K
K
 
K
G
 
G
I
 
T
V
 
V
Y
 
I
N
 
R
L
 
-
E
 
S
N
 
T
I
 
M
P
 
L
A
 
G
F
 
W
N
 
E
K
 
N
V
 
V
A
 
A
L
 
L
K
 
E
D
 
A
Y
 
M
L
 
L
E
 
H
R
 
A
T
 
H
L
 
F
-
 
P
E
 
D
K
 
I
P
 
P
V
 
V
Y
 
Y
I
 
V
N
 
D
N
 
K
D
x
N
A
 
I
N
 
N
C
 
C
F
 
Y
A
 
T
L
 
L
G
 
A
E
 
E
Y
 
L
K
 
W
F
 
L
G
 
G
G
 
E
A
 
G
N
 
K
K
 
Q
H
 
S
R
 
N
H
 
N
M
 
F
V
 
A
G
 
T
I
 
V
T
x
S
L
x
V
G
 
G
T
 
A
G
|
G
I
x
L
G
|
G
T
 
L
G
 
S
V
 
V
I
 
V
T
 
I
N
 
N
G
 
R
E
 
Q
L
 
I
Y
 
Y
P
 
Y
G
 
G
F
 
A
L
 
Q
C
 
G
G
 
G
A
 
A
G
 
G
E
|
E
W
 
F
G
 
G
G
x
H
V
 
T
P
 
T
Y
 
I
L
 
Q
D
 
P
S
 
G
N
 
G
F
 
Y
E
 
K
N
x
C
Y
 
H
C
|
C
S
 
G
S
 
Q
K
 
K
-
 
G
-
x
C
-
 
L
-
x
E
-
 
M
-
 
Y
-
 
A
-
 
S
-
 
E
-
 
F
F
 
Y
F
 
F
R
 
R
K
 
N
-
 
R
-
 
G
-
 
E
-
 
E
-
 
L
-
 
K
-
 
E
-
 
A
-
 
Y
-
 
P
L
 
L
H
 
N
H
 
D
T
 
F
T
 
H
A
 
F
K
 
D
K
 
K
L
 
V
A
 
A
A
 
K
K
 
S
A
 
A
A
 
R
E
 
A
G
 
G
D
 
D
Q
 
E
E
 
M
A
 
A
L
 
T
K
 
E
L
 
L
F
 
M
Y
 
G
E
 
K
Y
 
M
G
 
G
T
 
E
H
 
Y
I
 
L
G
 
G
N
 
Y
L
 
G
I
 
I
K
 
R
Y
 
N
I
 
I
L
 
I
F
 
N
T
 
T
Y
 
F
A
 
N
P
 
P
E
 
E
A
 
K
I
 
V
V
 
I
I
 
I
G
 
V
G
 
G
S
x
E
I
 
G
R
 
L
K
 
H
A
 
H
F
 
R
P
 
D
Y
 
L
F
 
F
S
 
L
K
 
T
G
 
K
L
 
I
K
 
D
E
 
E
T
 
I
V
 
A
E
 
S
T
 
Q
F
 
N
P
 
F
Y
 
F
S
 
S
S
 
G
I
 
A
S
 
G
D
 
F
N
 
E
L
 
T
T
 
E
I
 
I
Y
 
T
T
 
T
S
 
T
S
 
S
F
 
L
D
 
E
D
 
D
S
 
P
A
 
A
I
x
W
M
 
L
G
 
Q
A
 
G
A
 
A
A
 
A
L
 
L
V
 
L
T
 
V

Sites not aligning to the query:

5f7qE Rok repressor lmo0178 from listeria monocytogenes bound to operator (see paper)
26% identity, 88% coverage: 24:280/291 of query aligns to 102:385/396 of 5f7qE

query
sites
5f7qE
D
 
N
G
 
A
E
 
E
L
 
I
I
 
I
E
 
E
K
 
N
R
 
T
E
 
S
I
 
I
P
 
P
T
 
F
P
 
S
S
 
S
Q
 
E
-
 
K
-
 
K
-
 
P
-
 
E
E
 
E
P
 
A
Q
 
I
E
 
E
V
 
L
I
 
I
L
 
A
S
 
K
T
 
N
I
 
V
A
 
K
D
 
K
F
 
M
I
 
C
A
 
G
S
 
N
Y
 
R
F
 
D
S
 
M
H
 
N
E
 
H
I
 
L
D
 
L
G
 
G
I
 
V
G
 
G
I
 
I
G
 
A
I
 
I
P
 
S
G
 
G
L
 
L
V
 
V
D
 
N
A
 
R
E
 
K
K
 
K
G
 
G
I
 
T
V
 
V
Y
 
I
N
 
R
L
 
-
E
 
S
N
 
T
I
 
M
P
 
L
A
 
G
F
 
W
N
 
E
K
 
N
V
 
V
A
 
A
L
 
L
K
 
E
D
 
A
Y
 
M
L
 
L
E
 
H
R
 
A
T
 
H
L
 
F
-
 
P
E
 
D
K
 
I
P
 
P
V
 
V
Y
 
Y
I
 
V
N
 
D
N
 
K
D
 
N
A
 
I
N
 
N
C
 
C
F
 
Y
A
 
T
L
 
L
G
 
A
E
 
E
Y
 
L
K
 
W
F
 
L
G
 
G
G
 
E
A
 
G
N
 
K
K
 
Q
H
 
S
R
 
N
H
 
N
M
 
F
V
 
A
G
 
T
I
 
V
T
 
S
L
 
V
G
 
G
T
 
A
G
 
G
I
 
L
G
 
G
T
 
L
G
 
S
V
 
V
I
 
V
T
 
I
N
 
N
G
 
R
E
 
Q
L
 
I
Y
 
Y
P
 
Y
G
 
G
F
 
A
L
 
Q
C
 
G
G
 
G
A
 
A
G
 
G
E
 
E
W
 
F
G
 
G
G
x
H
V
 
T
P
 
T
Y
 
I
L
 
Q
D
 
P
S
 
G
N
 
G
F
 
Y
E
 
K
N
x
C
Y
 
H
C
|
C
S
 
G
S
 
Q
K
 
K
-
 
G
-
x
C
-
 
L
-
 
E
-
 
M
-
 
Y
-
 
A
-
 
S
-
 
E
-
 
F
F
 
Y
F
 
F
R
 
R
-
 
N
-
 
R
-
 
G
-
 
E
-
 
E
-
 
L
-
 
K
-
 
E
-
 
A
-
 
Y
-
 
P
-
 
T
-
 
S
K
 
E
L
 
L
H
 
N
H
 
D
T
 
F
T
 
H
A
 
F
K
 
D
K
 
K
L
 
V
A
 
A
A
 
K
K
 
S
A
 
A
A
 
R
E
 
A
G
 
G
D
 
D
Q
 
E
E
 
M
A
 
A
L
 
T
K
 
E
L
 
L
F
 
M
Y
 
G
E
 
K
Y
 
M
G
 
G
T
 
E
H
 
Y
I
 
L
G
 
G
N
 
Y
L
 
G
I
 
I
K
 
R
Y
 
N
I
 
I
L
 
I
F
 
N
T
 
T
Y
 
F
A
 
N
P
 
P
E
 
E
A
 
K
I
 
V
V
 
I
I
 
I
G
 
V
G
 
G
S
 
E
I
 
G
R
 
L
K
 
H
A
 
H
F
 
R
P
 
D
Y
 
L
F
 
F
S
 
L
K
 
T
G
 
K
L
 
I
K
 
D
E
 
E
T
 
I
V
 
A
E
 
S
T
 
Q
F
 
N
P
 
F
Y
 
F
S
 
S
S
 
G
I
 
A
S
 
G
D
 
F
N
 
E
L
 
T
T
 
E
I
 
I
Y
 
T
T
 
T
S
 
T
S
 
S
F
 
L
D
 
E
D
 
D
S
 
P
A
 
A
I
 
W
M
 
L
G
 
Q
A
 
G
A
 
A
A
 
A
L
 
L
V
 
L
T
 
V

Sites not aligning to the query:

Q93LQ8 Beta-glucoside kinase; EC 2.7.1.85 from Klebsiella pneumoniae (see paper)
28% identity, 92% coverage: 7:275/291 of query aligns to 3:281/297 of Q93LQ8

query
sites
Q93LQ8
I
 
I
L
 
A
G
 
A
L
 
F
D
|
D
I
 
I
G
|
G
G
 
G
T
 
T
S
 
A
I
 
L
N
 
K
A
 
M
G
 
G
I
 
V
M
 
M
-
 
A
K
 
R
D
 
D
G
 
G
E
 
R
L
 
L
I
 
L
E
 
E
K
 
T
R
 
A
E
 
R
I
 
-
P
 
Q
T
 
S
P
 
I
S
 
N
Q
 
D
E
 
S
P
 
D
Q
 
G
E
 
D
V
 
R
I
 
I
L
 
L
S
 
Q
T
 
A
I
 
M
A
 
L
D
 
S
F
 
W
I
 
L
A
 
A
S
 
A
Y
 
H
F
 
P
S
 
S
H
 
C
E
 
E
I
 
-
D
 
-
G
 
G
I
 
I
G
 
A
I
 
I
G
 
S
I
 
A
P
 
P
G
 
G
L
 
Y
V
 
I
D
 
D
A
 
P
E
 
H
K
 
S
G
 
G
I
 
L
V
 
I
Y
 
T
N
 
M
L
 
G
E
 
G
N
 
A
I
 
I
P
 
R
A
 
R
F
 
F
N
 
D
K
 
N
V
 
F
A
 
A
L
 
M
K
 
K
D
 
S
Y
 
W
L
 
L
E
 
E
R
 
T
T
 
R
L
 
T
E
 
G
K
 
L
P
 
P
V
 
V
Y
 
S
I
 
V
N
 
E
N
 
N
D
|
D
A
 
A
N
 
N
C
 
C
F
 
V
A
 
L
L
 
L
G
 
A
E
 
E
Y
 
R
K
 
W
F
 
Q
G
 
G
G
 
K
A
 
A
N
 
A
K
 
E
H
 
M
R
 
A
H
 
N
M
 
F
V
 
L
G
 
V
I
 
L
T
 
T
L
 
I
G
 
G
T
 
T
G
|
G
I
 
I
G
|
G
T
 
G
G
 
A
V
 
I
I
 
F
T
 
C
N
 
Q
G
 
H
E
 
Q
L
 
L
Y
 
I
P
 
N
G
 
G
F
 
A
L
 
R
C
 
F
G
 
R
A
 
A
G
 
G
E
 
E
W
 
F
G
 
G
G
 
Y
V
 
M
-
 
L
-
 
T
-
 
D
-
 
R
-
 
P
-
 
G
-
 
G
-
 
R
-
 
D
P
 
P
Y
 
R
L
 
R
D
 
Y
S
 
S
N
 
M
F
 
N
E
 
E
N
 
N
Y
 
-
C
 
C
S
 
T
S
 
L
K
 
R
F
 
V
F
 
L
R
 
R
K
 
H
-
 
R
-
 
Y
-
 
A
-
 
Q
-
 
H
-
 
I
-
 
G
-
 
A
-
 
P
L
 
L
H
 
D
H
 
S
T
 
V
T
 
T
A
 
G
K
 
E
K
 
L
L
 
I
A
 
F
A
 
D
K
 
R
A
 
Y
A
 
D
E
 
A
G
 
G
D
 
D
Q
 
P
E
 
V
A
 
C
L
 
Q
K
 
R
L
 
L
F
 
V
Y
 
A
E
 
E
Y
 
F
G
 
F
T
 
N
H
 
G
I
 
L
G
 
G
N
 
H
L
 
G
I
 
L
K
 
Y
Y
 
N
I
 
L
L
 
V
F
 
H
T
 
I
Y
 
F
A
 
D
P
 
P
E
 
Q
A
 
T
I
 
I
V
 
F
I
 
I
G
 
G
G
 
G
S
 
G
I
 
V
R
 
V
K
 
E
A
 
R
F
 
-
P
 
P
Y
 
G
F
 
F
S
 
L
K
 
T
G
 
L
L
 
L
K
 
R
E
 
Q
T
 
H
V
 
L
E
 
A
T
 
W
F
 
F
P
 
-
Y
 
-
S
 
-
S
 
G
I
 
I
S
 
A
D
 
D
N
 
Y
L
 
L
T
 
D
I
 
T
Y
 
-
T
 
V
S
 
S
S
 
H
F
 
G
D
 
N
D
 
D
S
 
A
A
 
G
I
 
L
M
 
I
G
 
G
A
 
A

6jdoA Crystal structure of n-acetyl mannosmaine kinase with amp-pnp from pasteurella multocida
25% identity, 95% coverage: 8:282/291 of query aligns to 4:289/293 of 6jdoA

query
sites
6jdoA
L
 
L
G
 
A
L
 
L
D
 
D
I
 
I
G
 
G
G
 
G
T
 
T
S
 
K
I
 
I
N
 
A
A
 
S
G
 
A
I
 
I
M
 
V
K
 
T
D
 
D
G
 
G
E
 
K
L
 
I
I
 
E
E
 
Q
K
 
R
R
 
Q
E
 
Q
I
 
I
P
 
A
T
 
T
P
 
P
S
 
Q
Q
 
A
E
 
D
P
 
A
Q
 
A
E
 
N
V
 
A
I
 
M
L
 
H
S
 
D
T
 
T
I
 
L
A
 
A
D
 
N
F
 
I
I
 
L
A
 
A
S
 
L
Y
 
Y
F
 
-
S
 
A
H
 
G
E
 
Q
I
 
F
D
 
D
G
 
Y
I
 
V
G
 
A
I
 
V
G
 
A
I
 
S
P
 
T
G
 
G
L
 
I
V
 
I
D
 
N
A
 
H
E
 
G
K
 
V
G
 
L
I
 
T
V
 
A
Y
 
L
N
 
N
L
 
P
E
 
K
N
 
N
I
 
L
P
 
G
A
 
G
F
 
L
N
 
A
K
 
E
V
 
F
A
 
P
L
 
L
K
 
K
D
 
E
Y
 
S
L
 
I
E
 
A
R
 
R
T
 
H
L
 
T
E
 
D
K
 
K
P
 
P
V
 
I
Y
 
G
I
 
L
N
 
L
N
 
N
D
 
D
A
 
V
N
 
Q
C
 
A
F
 
A
A
 
A
L
 
C
G
 
A
E
 
E
Y
 
Y
K
 
K
F
 
D
G
 
E
G
 
D
A
 
K
N
 
N
K
 
A
H
 
V
R
 
Q
H
 
N
M
 
F
V
 
V
G
 
F
I
 
I
T
 
T
L
 
V
G
x
S
T
|
T
G
 
G
I
 
V
G
 
G
T
 
G
G
 
G
V
 
I
I
 
I
T
 
L
N
 
E
G
 
R
E
 
R
L
 
L
Y
 
L
P
 
T
-
 
E
-
 
P
-
 
N
-
 
G
-
 
V
-
 
A
-
 
G
-
 
H
-
 
I
-
 
G
-
x
H
-
 
T
-
 
L
-
 
A
-
 
D
-
 
P
-
 
N
G
 
G
F
 
P
L
 
V
C
|
C
G
 
G
A
x
C
G
 
G
E
x
R
W
 
V
G
 
G
-
 
C
-
 
V
-
 
E
-
 
A
-
 
V
-
 
A
-
 
A
-
x
G
-
 
R
G
 
A
V
 
I
P
 
E
Y
 
A
L
 
V
D
 
S
S
 
S
N
 
Q
F
 
W
E
 
N
N
 
P
Y
 
P
C
 
C
S
 
T
S
x
P
K
 
K
-
 
Q
-
 
A
-
x
F
-
 
E
F
 
L
F
 
F
R
 
R
K
 
K
L
 
-
H
 
-
H
 
-
T
 
-
T
 
-
A
 
-
K
 
-
K
 
-
L
 
-
A
 
-
A
 
-
K
 
-
A
 
-
A
 
-
E
 
-
G
 
N
D
 
D
Q
 
E
E
 
K
A
 
A
L
 
T
K
 
A
L
 
L
F
 
I
Y
 
Q
E
 
R
Y
 
S
G
 
A
T
 
S
H
 
A
I
 
I
G
 
A
N
 
N
L
 
L
I
 
I
K
 
A
Y
 
D
I
 
L
L
 
V
F
 
I
T
 
G
Y
 
L
A
 
D
P
 
V
E
 
Q
A
 
K
I
 
V
V
 
V
I
 
V
G
 
G
G
 
G
S
|
S
I
 
V
R
 
G
K
 
L
A
 
A
F
 
E
P
 
G
Y
 
Y
F
 
L
S
 
P
K
 
L
G
 
-
L
 
V
K
 
K
E
 
Q
T
 
Y
V
 
L
E
 
N
T
 
T
F
 
M
P
 
P
Y
 
H
S
 
F
S
 
Y
I
 
-
S
 
-
D
 
-
N
 
H
L
 
C
T
 
T
I
 
V
Y
 
E
T
 
Q
S
 
A
S
 
R
F
 
H
-
 
G
D
 
Q
D
 
D
S
 
A
A
 
G
I
 
L
M
 
L
G
 
G
A
 
A
A
 
A
A
 
W
L
 
W
V
 
V
T
 
A
E
 
D
A
 
C

6jdhA Crystal structure of n-acetyl mannosmaine kinase from pasteurella multocida
25% identity, 95% coverage: 8:282/291 of query aligns to 4:289/293 of 6jdhA

query
sites
6jdhA
L
 
L
G
 
A
L
 
L
D
 
D
I
 
I
G
 
G
G
 
G
T
 
T
S
 
K
I
 
I
N
 
A
A
 
S
G
 
A
I
 
I
M
 
V
K
 
T
D
 
D
G
 
G
E
 
K
L
 
I
I
 
E
E
 
Q
K
 
R
R
 
Q
E
 
Q
I
 
I
P
 
A
T
 
T
P
 
P
S
 
Q
Q
 
A
E
 
D
P
 
A
Q
 
A
E
 
N
V
 
A
I
 
M
L
 
H
S
 
D
T
 
T
I
 
L
A
 
A
D
 
N
F
 
I
I
 
L
A
 
A
S
 
L
Y
 
Y
F
 
-
S
 
A
H
 
G
E
 
Q
I
 
F
D
 
D
G
 
Y
I
 
V
G
 
A
I
 
V
G
 
A
I
 
S
P
 
T
G
 
G
L
 
I
V
 
I
D
 
N
A
 
H
E
 
G
K
 
V
G
 
L
I
 
T
V
 
A
Y
 
L
N
 
N
L
 
P
E
 
K
N
 
N
I
 
L
P
 
G
A
 
G
F
 
L
N
 
A
K
 
E
V
 
F
A
 
P
L
 
L
K
 
K
D
 
E
Y
 
S
L
 
I
E
 
A
R
 
R
T
 
H
L
 
T
E
 
D
K
 
K
P
 
P
V
 
I
Y
 
G
I
 
L
N
 
L
N
 
N
D
 
D
A
 
V
N
 
Q
C
 
A
F
 
A
A
 
A
L
 
C
G
 
A
E
 
E
Y
 
Y
K
 
K
F
 
D
G
 
E
G
 
D
A
 
K
N
 
N
K
 
A
H
 
V
R
 
Q
H
 
N
M
 
F
V
 
V
G
 
F
I
 
I
T
 
T
L
 
V
G
 
S
T
 
T
G
 
G
I
 
V
G
 
G
T
 
G
G
 
G
V
 
I
I
 
I
T
 
L
N
 
E
G
 
R
E
 
R
L
 
L
Y
 
L
P
 
T
-
 
E
-
 
P
-
 
N
-
 
G
-
 
V
-
 
A
-
 
G
-
 
H
-
 
I
-
 
G
-
x
H
-
 
T
-
 
L
-
 
A
-
 
D
-
 
P
-
 
N
G
 
G
F
 
P
L
 
V
C
|
C
G
 
G
A
x
C
G
 
G
E
 
R
W
 
V
G
 
G
-
x
C
-
 
V
-
 
E
-
 
A
-
 
V
-
 
A
-
 
A
-
 
G
-
 
R
G
 
A
V
 
I
P
 
E
Y
 
A
L
 
V
D
 
S
S
 
S
N
 
Q
F
 
W
E
 
N
N
 
P
Y
 
P
C
 
C
S
 
T
S
 
P
K
 
K
-
 
Q
-
 
A
-
 
F
-
 
E
F
 
L
F
 
F
R
 
R
K
 
K
L
 
-
H
 
-
H
 
-
T
 
-
T
 
-
A
 
-
K
 
-
K
 
-
L
 
-
A
 
-
A
 
-
K
 
-
A
 
-
A
 
-
E
 
-
G
 
N
D
 
D
Q
 
E
E
 
K
A
 
A
L
 
T
K
 
A
L
 
L
F
 
I
Y
 
Q
E
 
R
Y
 
S
G
 
A
T
 
S
H
 
A
I
 
I
G
 
A
N
 
N
L
 
L
I
 
I
K
 
A
Y
 
D
I
 
L
L
 
V
F
 
I
T
 
G
Y
 
L
A
 
D
P
 
V
E
 
Q
A
 
K
I
 
V
V
 
V
I
 
V
G
 
G
G
 
G
S
 
S
I
 
V
R
 
G
K
 
L
A
 
A
F
 
E
P
 
G
Y
 
Y
F
 
L
S
 
P
K
 
L
G
 
-
L
 
V
K
 
K
E
 
Q
T
 
Y
V
 
L
E
 
N
T
 
T
F
 
M
P
 
P
Y
 
H
S
 
F
S
 
Y
I
 
-
S
 
-
D
 
-
N
 
H
L
 
C
T
 
T
I
 
V
Y
 
E
T
 
Q
S
 
A
S
 
R
F
 
H
-
 
G
D
 
Q
D
 
D
S
 
A
A
 
G
I
 
L
M
 
L
G
 
G
A
 
A
A
 
A
A
 
W
L
 
W
V
 
V
T
 
A
E
 
D
A
 
C

7p9lAAA Ubiquitin-like protein SMT3,N-acetyl-D-glucosamine kinase
30% identity, 77% coverage: 9:233/291 of query aligns to 5:257/303 of 7p9lAAA

query
sites
7p9lAAA
G
 
G
L
 
F
D
 
D
I
 
I
G
 
G
G
 
G
T
 
T
S
 
K
I
 
I
N
 
E
A
 
F
G
 
G
I
 
A
M
 
F
K
 
-
D
 
D
G
 
A
E
 
D
L
 
L
I
 
V
E
 
R
-
 
V
-
 
A
K
 
R
R
 
E
E
 
R
I
 
V
P
 
A
T
 
T
P
 
P
S
 
T
Q
 
-
E
 
E
P
 
S
Q
 
Y
E
 
A
V
 
A
I
 
F
L
 
L
S
 
D
T
 
A
I
 
I
A
 
V
D
 
T
F
 
L
I
 
V
A
 
N
S
 
N
Y
 
A
F
 
D
S
 
A
H
 
E
-
 
F
E
 
G
I
 
V
D
 
K
G
 
G
-
 
T
I
 
V
G
 
G
I
 
I
G
 
G
I
 
I
P
|
P
G
|
G
L
 
I
V
 
A
D
 
D
A
 
V
E
 
E
K
 
T
G
 
G
I
 
K
V
 
L
Y
 
L
N
 
T
L
 
-
E
x
S
N
 
N
I
 
I
P
 
P
A
 
A
F
 
A
N
 
M
K
 
G
V
 
H
A
 
T
L
 
L
K
 
Q
D
 
R
Y
 
D
L
 
L
E
 
E
R
 
E
T
 
R
L
 
L
E
 
Q
K
 
R
P
 
P
V
 
V
Y
 
K
I
 
I
N
 
E
N
|
N
D
|
D
A
 
A
N
 
N
C
 
C
F
 
F
A
 
A
L
 
L
G
 
S
E
 
E
Y
 
A
K
 
W
F
 
D
G
 
E
G
 
D
A
 
L
N
 
R
K
 
G
H
 
E
R
 
P
H
 
S
M
 
V
V
 
L
G
 
G
I
 
L
T
 
I
L
 
L
G
|
G
T
|
T
G
|
G
I
x
V
G
|
G
T
 
G
G
 
G
V
 
L
I
 
I
T
 
F
N
 
N
G
 
G
E
 
K
L
 
V
Y
 
H
P
 
S
G
 
G
F
 
R
L
 
A
C
 
N
G
 
I
A
 
A
G
 
G
E
|
E
W
 
I
G
 
G
-
x
H
-
 
T
G
 
R
V
 
L
P
 
P
Y
 
Y
L
 
D
-
 
A
-
 
L
-
 
K
-
 
L
-
 
L
-
 
G
-
 
M
-
 
E
-
 
N
-
 
A
-
 
P
-
 
I
-
 
F
-
 
P
-
x
C
-
 
G
-
x
C
-
 
K
-
 
N
D
 
S
S
 
G
N
x
C
F
 
I
E
x
D
N
 
N
Y
 
Y
C
 
L
S
 
S
S
 
G
K
 
R
F
 
G
F
 
F
R
 
E
K
 
Q
L
 
L
H
 
Y
-
 
D
H
 
H
T
 
Y
T
 
F
A
 
S
K
 
E
K
 
K
L
 
L
A
 
S
A
 
A
K
 
P
A
x
E
-
 
I
-
 
I
-
 
A
-
x
H
-
 
Y
A
 
E
E
 
Q
G
 
G
D
 
E
Q
 
R
E
 
R
A
 
A
L
 
V
K
 
Q
L
 
H
F
 
V
Y
 
E
E
 
R
Y
 
F
G
 
M
T
 
E
H
 
L
I
 
L
G
 
A
N
 
I
L
 
C
I
 
L
K
 
A
Y
 
N
I
 
I
L
 
F
F
 
T
T
 
C
Y
 
L
A
 
D
P
 
P
E
 
H
A
 
V
I
 
V
V
 
V
I
 
L
G
 
G
G
 
G
S
 
G
I
 
L

7p9pAAA Ubiquitin-like protein SMT3,N-acetyl-D-glucosamine kinase
30% identity, 77% coverage: 9:233/291 of query aligns to 6:258/304 of 7p9pAAA

query
sites
7p9pAAA
G
 
G
L
 
F
D
 
D
I
 
I
G
 
G
G
|
G
T
|
T
S
x
K
I
 
I
N
 
E
A
 
F
G
 
G
I
 
A
M
 
F
K
 
-
D
 
D
G
 
A
E
 
D
L
 
L
I
 
V
E
 
R
-
 
V
-
 
A
K
 
R
R
 
E
E
 
R
I
 
V
P
 
A
T
 
T
P
 
P
S
 
T
Q
 
-
E
 
E
P
 
S
Q
 
Y
E
 
A
V
 
A
I
 
F
L
 
L
S
 
D
T
 
A
I
 
I
A
 
V
D
 
T
F
 
L
I
 
V
A
 
N
S
 
N
Y
 
A
F
 
D
S
 
A
H
 
E
-
 
F
E
 
G
I
 
V
D
 
K
G
 
G
-
 
T
I
 
V
G
 
G
I
 
I
G
 
G
I
 
I
P
 
P
G
 
G
L
 
I
V
 
A
D
 
D
A
 
V
E
 
E
K
 
T
G
 
G
I
 
K
V
 
L
Y
 
L
N
 
T
L
 
-
E
 
S
N
 
N
I
 
I
P
 
P
A
 
A
F
 
A
N
 
M
K
 
G
V
 
H
A
 
T
L
 
L
K
 
Q
D
 
R
Y
 
D
L
 
L
E
 
E
R
 
E
T
 
R
L
 
L
E
 
Q
K
 
R
P
 
P
V
 
V
Y
 
K
I
 
I
N
 
E
N
 
N
D
 
D
A
 
A
N
 
N
C
 
C
F
 
F
A
 
A
L
 
L
G
 
S
E
 
E
Y
 
A
K
 
W
F
 
D
G
 
E
G
 
D
A
 
L
N
 
R
K
 
G
H
 
E
R
 
P
H
 
S
M
 
V
V
 
L
G
 
G
I
 
L
T
 
I
L
 
L
G
|
G
T
|
T
G
 
G
I
 
V
G
 
G
T
 
G
G
 
G
V
 
L
I
 
I
T
 
F
N
 
N
G
 
G
E
 
K
L
 
V
Y
 
H
P
 
S
G
 
G
F
 
R
L
 
A
C
 
N
G
 
I
A
 
A
G
 
G
E
 
E
W
 
I
G
 
G
-
x
H
-
 
T
G
 
R
V
 
L
P
 
P
Y
 
Y
L
 
D
-
 
A
-
 
L
-
 
K
-
 
L
-
 
L
-
 
G
-
 
M
-
 
E
-
 
N
-
 
A
-
 
P
-
 
I
-
 
F
-
 
P
-
x
C
-
 
G
-
x
C
-
 
K
-
 
N
D
 
S
S
 
G
N
x
C
F
 
I
E
 
D
N
 
N
Y
 
Y
C
 
L
S
 
S
S
x
G
K
 
R
F
 
G
F
 
F
R
x
E
K
 
Q
L
 
L
H
 
Y
-
 
D
H
 
H
T
 
Y
T
 
F
A
 
S
K
 
E
K
 
K
L
 
L
A
 
S
A
|
A
K
 
P
A
x
E
-
 
I
-
 
I
-
 
A
-
x
H
-
 
Y
A
 
E
E
 
Q
G
 
G
D
 
E
Q
 
R
E
 
R
A
 
A
L
 
V
K
 
Q
L
 
H
F
 
V
Y
 
E
E
 
R
Y
 
F
G
 
M
T
 
E
H
 
L
I
 
L
G
 
A
N
 
I
L
 
C
I
 
L
K
 
A
Y
 
N
I
 
I
L
 
F
F
 
T
T
 
C
Y
 
L
A
 
D
P
 
P
E
 
H
A
 
V
I
 
V
V
 
V
I
 
L
G
 
G
G
|
G
S
x
G
I
 
L

Sites not aligning to the query:

7p7wBBB Ubiquitin-like protein SMT3,N-acetyl-D-glucosamine kinase
30% identity, 77% coverage: 9:233/291 of query aligns to 8:260/306 of 7p7wBBB

query
sites
7p7wBBB
G
 
G
L
 
F
D
 
D
I
 
I
G
 
G
G
 
G
T
 
T
S
 
K
I
 
I
N
 
E
A
 
F
G
 
G
I
 
A
M
 
F
K
 
-
D
 
D
G
 
A
E
 
D
L
 
L
I
 
V
E
 
R
-
 
V
-
 
A
K
 
R
R
 
E
E
 
R
I
 
V
P
 
A
T
 
T
P
 
P
S
 
T
Q
 
-
E
 
E
P
 
S
Q
 
Y
E
 
A
V
 
A
I
 
F
L
 
L
S
 
D
T
 
A
I
 
I
A
 
V
D
 
T
F
 
L
I
 
V
A
 
N
S
 
N
Y
 
A
F
 
D
S
 
A
H
 
E
-
 
F
E
 
G
I
 
V
D
 
K
G
 
G
-
 
T
I
 
V
G
 
G
I
 
I
G
 
G
I
 
I
P
 
P
G
 
G
L
 
I
V
 
A
D
 
D
A
 
V
E
 
E
K
 
T
G
 
G
I
 
K
V
 
L
Y
 
L
N
 
T
L
 
-
E
 
S
N
 
N
I
 
I
P
 
P
A
 
A
F
 
A
N
 
M
K
 
G
V
 
H
A
 
T
L
 
L
K
 
Q
D
 
R
Y
 
D
L
 
L
E
 
E
R
 
E
T
 
R
L
 
L
E
 
Q
K
 
R
P
 
P
V
 
V
Y
 
K
I
 
I
N
 
E
N
 
N
D
 
D
A
 
A
N
 
N
C
 
C
F
 
F
A
 
A
L
 
L
G
 
S
E
 
E
Y
 
A
K
 
W
F
 
D
G
 
E
G
 
D
A
 
L
N
 
R
K
 
G
H
 
E
R
 
P
H
 
S
M
 
V
V
 
L
G
 
G
I
 
L
T
 
I
L
 
L
G
|
G
T
|
T
G
 
G
I
 
V
G
 
G
T
 
G
G
 
G
V
 
L
I
 
I
T
 
F
N
 
N
G
 
G
E
 
K
L
 
V
Y
 
H
P
 
S
G
 
G
F
 
R
L
 
A
C
 
N
G
 
I
A
 
A
G
 
G
E
 
E
W
 
I
G
 
G
-
x
H
-
 
T
G
 
R
V
 
L
P
 
P
Y
 
Y
L
 
D
-
 
A
-
 
L
-
 
K
-
 
L
-
 
L
-
 
G
-
 
M
-
 
E
-
 
N
-
 
A
-
 
P
-
 
I
-
 
F
-
 
P
-
x
C
-
 
G
-
x
C
-
 
K
-
 
N
D
 
S
S
 
G
N
x
C
F
 
I
E
 
D
N
 
N
Y
 
Y
C
 
L
S
 
S
S
x
G
K
 
R
F
 
G
F
 
F
R
x
E
K
 
Q
L
 
L
H
 
Y
-
 
D
H
 
H
T
 
Y
T
 
F
A
 
S
K
 
E
K
 
K
L
 
L
A
 
S
A
 
A
K
 
P
A
 
E
-
 
I
-
 
I
-
 
A
-
 
H
-
 
Y
A
 
E
E
 
Q
G
 
G
D
 
E
Q
 
R
E
 
R
A
 
A
L
 
V
K
 
Q
L
 
H
F
 
V
Y
 
E
E
 
R
Y
 
F
G
 
M
T
 
E
H
 
L
I
 
L
G
 
A
N
 
I
L
 
C
I
 
L
K
 
A
Y
 
N
I
 
I
L
 
F
F
 
T
T
 
C
Y
 
L
A
 
D
P
 
P
E
 
H
A
 
V
I
 
V
V
 
V
I
 
L
G
 
G
G
|
G
S
x
G
I
 
L

Sites not aligning to the query:

1z05A Crystal structure of the rok family transcriptional regulator, homolog of e.Coli mlc protein.
25% identity, 82% coverage: 44:282/291 of query aligns to 118:383/396 of 1z05A

query
sites
1z05A
I
 
L
L
 
L
S
 
F
T
 
E
I
 
I
A
 
E
D
 
E
F
 
F
I
 
F
A
 
Q
S
 
T
Y
 
Y
F
 
A
S
 
A
H
 
Q
-
 
L
-
 
D
E
 
R
I
 
V
D
 
T
G
 
S
I
 
I
G
 
A
I
 
I
G
 
T
I
 
L
P
 
P
G
 
G
L
 
L
V
 
V
D
 
N
A
 
S
E
 
E
K
 
Q
G
 
G
I
 
I
V
 
V
Y
 
L
N
 
Q
L
 
M
E
 
-
N
 
-
I
 
-
P
 
P
A
 
H
F
 
Y
N
 
N
-
 
V
-
 
K
K
 
N
V
 
L
A
 
A
L
 
L
K
 
G
D
 
P
Y
 
E
L
 
I
E
 
Y
R
 
K
T
 
A
L
 
T
E
 
G
K
 
L
P
 
P
V
 
V
Y
 
F
I
 
V
N
 
A
N
 
N
D
 
D
A
 
T
N
 
R
C
 
A
F
 
W
A
 
A
L
 
L
G
 
A
E
 
E
Y
 
K
K
 
L
F
 
F
G
 
G
G
 
H
A
 
S
N
 
Q
K
 
D
H
 
V
R
 
D
H
 
N
M
 
S
V
 
V
G
 
L
I
 
I
T
 
S
L
 
I
G
 
H
T
 
H
G
 
G
I
 
L
G
 
G
T
 
A
G
 
G
V
 
I
I
 
V
T
 
L
N
 
D
G
 
G
E
 
R
L
 
V
Y
 
L
P
 
Q
G
 
G
F
 
R
L
 
H
C
 
G
G
 
N
A
 
I
G
 
G
E
 
E
W
 
L
G
 
G
G
x
H
V
 
I
P
 
Q
Y
 
I
L
 
D
D
 
P
S
 
Q
N
 
G
F
 
K
E
 
R
N
x
C
Y
 
H
C
|
C
-
 
G
-
 
N
-
 
Y
-
 
G
-
x
C
-
 
L
-
 
E
-
 
T
-
 
V
-
 
A
S
 
S
S
 
S
K
 
Q
F
 
A
F
 
I
R
 
R
K
 
D
-
 
Q
-
 
V
-
 
T
-
 
A
-
 
R
-
 
I
-
 
Q
-
 
A
-
 
G
-
 
E
-
 
P
-
 
S
-
 
C
-
 
L
-
 
A
-
 
T
L
 
V
H
 
E
H
 
E
T
 
I
T
 
S
A
 
I
K
 
E
K
 
D
L
 
I
A
 
C
A
 
A
K
 
A
A
 
A
A
 
A
E
 
D
G
 
G
D
 
D
Q
 
P
E
 
L
A
 
A
L
 
V
K
 
D
L
 
V
F
 
I
Y
 
Q
E
 
Q
Y
 
L
G
 
G
T
 
R
H
 
Y
I
 
L
G
 
G
N
 
A
L
 
A
I
 
I
K
 
A
Y
 
I
I
 
V
L
 
I
F
 
N
T
 
L
Y
 
F
A
 
N
P
 
P
E
 
E
A
 
K
I
 
I
V
 
L
I
 
I
G
 
G
G
 
G
S
 
V
I
 
I
R
 
N
K
 
Q
A
 
A
F
 
K
P
 
S
Y
 
I
F
 
L
S
 
Y
K
 
P
G
 
S
L
 
I
K
 
E
E
 
Q
T
 
C
V
 
I
E
 
R
T
 
E
F
 
Q
P
 
S
Y
 
L
S
 
P
S
 
V
I
 
Y
S
 
H
D
 
Q
N
 
D
L
 
L
T
 
K
I
 
L
Y
 
V
T
 
E
S
 
S
S
 
R
F
 
F
D
 
Y
D
 
K
S
 
Q
A
 
A
I
 
T
M
 
M
G
 
P
A
 
G
A
 
A
A
 
A
L
 
L
V
 
I
T
 
K
E
 
Q
A
 
A

P50456 DNA-binding transcriptional repressor Mlc; Making large colonies protein; Membrane linked control from Escherichia coli (strain K12) (see 4 papers)
25% identity, 82% coverage: 44:282/291 of query aligns to 124:393/406 of P50456

query
sites
P50456
I
 
L
L
 
L
S
 
D
T
 
R
I
 
I
A
 
I
D
 
S
F
 
H
I
 
I
A
 
D
S
 
Q
Y
 
F
F
|
F
-
 
I
S
 
R
H
 
H
E
 
Q
-
 
K
-
 
K
-
 
L
-
 
E
-
 
R
I
 
L
D
 
T
G
 
S
I
 
I
G
 
A
I
 
I
G
 
T
I
 
L
P
 
P
G
 
G
L
 
I
V
 
I
D
 
D
A
 
T
E
 
E
K
 
N
G
 
G
I
 
I
V
 
V
Y
 
H
N
 
R
L
 
M
E
 
P
N
 
F
I
 
Y
P
 
E
A
 
D
F
 
V
N
 
K
K
 
E
V
 
M
A
 
P
L
 
L
K
 
G
D
 
E
Y
 
A
L
 
L
E
 
E
R
 
Q
T
 
H
L
 
T
E
 
G
K
 
V
P
 
P
V
 
V
Y
 
Y
I
 
I
N
 
Q
N
 
H
D
 
D
A
 
I
N
 
S
C
 
A
F
 
W
A
 
T
L
 
M
G
 
A
E
 
E
Y
 
A
K
 
L
F
 
F
G
 
G
G
 
A
A
 
S
N
 
R
K
 
G
H
 
A
R
 
R
H
 
D
M
 
V
V
 
I
G
 
Q
I
 
V
T
 
V
L
 
I
G
 
D
T
 
H
G
 
N
I
 
V
G
 
G
T
 
A
G
 
G
V
 
V
I
 
I
T
 
T
N
 
D
G
 
G
E
 
H
L
 
L
Y
 
L
P
 
H
-
 
A
-
 
G
-
 
S
-
 
S
-
 
S
-
 
L
-
 
V
-
 
E
-
 
I
-
 
G
-
x
H
-
 
T
-
 
Q
-
 
V
-
 
D
-
 
P
-
 
Y
G
 
G
F
 
K
L
 
R
C
|
C
G
 
Y
A
x
C
G
 
G
E
 
N
W
 
H
G
 
G
-
x
C
-
 
L
-
 
E
G
 
T
V
 
I
P
 
A
Y
 
S
L
 
V
D
 
D
S
 
S
N
 
I
F
 
L
E
 
E
-
 
L
-
 
A
-
 
Q
-
 
L
-
 
R
-
 
L
N
 
N
Y
 
Q
C
 
S
S
 
M
S
 
S
K
 
S
F
 
M
F
 
L
R
 
H
K
 
G
L
 
-
H
 
Q
H
 
P
T
 
L
T
 
T
A
 
V
K
 
D
K
 
S
L
 
L
A
 
C
A
 
Q
K
 
A
A
 
A
A
 
L
E
x
R
G
 
G
D
 
D
Q
 
L
E
x
L
A
 
A
L
 
K
K
 
D
L
 
I
F
 
I
Y
 
T
E
 
G
Y
 
V
G
 
G
T
 
A
H
 
H
I
 
V
G
 
G
N
 
R
L
 
I
I
 
L
K
 
A
Y
 
I
I
 
M
L
 
V
F
 
N
T
 
L
Y
 
F
A
 
N
P
 
P
E
 
Q
A
 
K
I
 
I
V
 
L
I
 
I
G
 
G
G
 
S
S
 
P
I
 
L
R
 
S
K
 
K
A
 
A
-
 
A
-
 
D
-
 
I
-
 
L
F
 
F
P
 
P
Y
 
V
F
 
I
S
 
S
K
 
D
G
 
S
L
 
I
K
 
R
E
 
Q
T
 
-
V
 
-
E
 
Q
T
 
A
F
 
L
P
 
P
Y
 
-
S
 
-
S
 
A
I
 
Y
S
 
S
D
 
Q
N
 
H
L
 
I
T
 
S
I
 
V
Y
 
E
T
 
S
S
 
T
S
 
Q
F
 
F
D
 
S
D
 
N
S
 
Q
A
 
G
I
 
T
M
 
M
G
 
A
A
 
G
A
 
A
A
 
A
L
 
L
V
 
V
T
 
K
E
 
D
A
 
A

Sites not aligning to the query:

1z6rA Crystal structure of mlc from escherichia coli (see paper)
25% identity, 87% coverage: 29:282/291 of query aligns to 88:369/382 of 1z6rA

query
sites
1z6rA
E
 
E
K
 
S
R
 
Q
E
 
E
I
 
L
P
 
A
T
 
L
P
 
K
S
 
D
Q
 
D
E
 
L
P
 
P
Q
 
-
E
 
-
V
 
-
I
 
L
L
 
L
S
 
D
T
 
R
I
 
I
A
 
I
D
 
S
F
 
H
I
 
I
A
 
D
S
 
Q
Y
 
F
F
 
F
-
 
I
S
 
R
H
 
H
E
 
Q
-
 
K
-
 
K
-
 
L
-
 
E
-
 
R
I
 
L
D
 
T
G
 
S
I
 
I
G
 
A
I
 
I
G
 
T
I
 
L
P
 
P
G
 
G
L
 
I
V
 
I
D
 
D
A
 
T
E
 
E
K
 
N
G
 
G
I
 
I
V
 
V
Y
 
H
N
 
R
L
 
M
E
 
P
N
 
F
I
 
Y
P
 
E
A
 
D
F
 
V
N
 
K
K
 
E
V
 
M
A
 
P
L
 
L
K
 
G
D
 
E
Y
 
A
L
 
L
E
 
E
R
 
Q
T
 
H
L
 
T
E
 
G
K
 
V
P
 
P
V
 
V
Y
 
Y
I
 
I
N
 
Q
N
 
H
D
 
D
A
 
I
N
 
S
C
 
A
F
 
W
A
 
T
L
 
M
G
 
A
E
 
E
Y
 
A
K
 
L
F
 
F
G
 
G
G
 
A
A
 
S
N
 
R
K
 
G
H
 
A
R
 
R
H
 
D
M
 
V
V
 
I
G
 
Q
I
 
V
T
 
V
L
 
I
G
 
D
T
 
H
G
 
N
I
 
V
G
 
G
T
 
A
G
 
G
V
 
V
I
 
I
T
 
T
N
 
D
G
 
G
E
 
H
L
 
L
Y
 
L
P
 
H
-
 
A
-
 
G
-
 
S
-
 
S
-
 
S
-
 
L
-
 
V
-
 
E
-
 
I
-
 
G
-
x
H
-
 
T
-
 
Q
-
 
V
-
 
D
-
 
P
-
 
Y
G
 
G
F
 
K
L
 
R
C
|
C
G
 
Y
A
x
C
G
 
G
E
 
N
W
 
H
G
 
G
-
x
C
-
 
L
-
 
E
G
 
T
V
 
I
P
 
A
Y
 
S
L
 
V
D
 
D
S
 
S
N
 
I
F
 
L
E
 
E
-
 
L
-
 
A
-
 
Q
-
 
L
-
 
R
-
 
L
N
 
N
Y
 
Q
C
 
S
S
 
M
S
 
S
K
 
S
F
 
M
F
 
L
R
 
H
K
 
G
L
 
-
H
 
Q
H
 
P
T
 
L
T
 
T
A
 
V
K
 
D
K
 
S
L
 
L
A
 
C
A
 
Q
K
 
A
A
 
A
A
 
L
E
 
R
G
 
G
D
 
D
Q
 
L
E
 
L
A
 
A
L
 
K
K
 
D
L
 
I
F
 
I
Y
 
T
E
 
G
Y
 
V
G
 
G
T
 
A
H
 
H
I
 
V
G
 
G
N
 
R
L
 
I
I
 
L
K
 
A
Y
 
I
I
 
M
L
 
V
F
 
N
T
 
L
Y
 
F
A
 
N
P
 
P
E
 
Q
A
 
K
I
 
I
V
 
L
I
 
I
G
 
G
G
 
S
S
 
P
I
 
L
R
 
S
K
 
K
A
 
A
-
 
A
-
 
D
-
 
I
-
 
L
F
 
F
P
 
P
Y
 
V
F
 
I
S
 
S
K
 
D
G
 
S
L
 
I
K
 
R
E
 
Q
T
 
-
V
 
-
E
 
Q
T
 
A
F
 
L
P
 
P
Y
 
-
S
 
-
S
 
A
I
 
Y
S
 
S
D
 
Q
N
 
H
L
 
I
T
 
S
I
 
V
Y
 
E
T
 
S
S
 
T
S
 
Q
F
 
F
D
 
S
D
 
N
S
 
Q
A
 
G
I
 
T
M
 
M
G
 
A
A
 
G
A
 
A
A
 
A
L
 
L
V
 
V
T
 
K
E
 
D
A
 
A

2qm1B Crystal structure of glucokinase from enterococcus faecalis
27% identity, 96% coverage: 4:281/291 of query aligns to 5:321/325 of 2qm1B

query
sites
2qm1B
N
 
D
R
 
K
L
 
K
I
 
I
L
 
I
G
 
G
L
 
I
D
 
D
I
 
L
G
 
G
G
 
G
T
 
T
S
 
T
I
 
I
N
 
K
A
 
F
G
 
A
I
 
I
M
 
L
K
 
T
-
 
T
D
 
D
G
 
G
E
 
V
L
 
V
I
 
Q
E
 
Q
K
 
K
R
 
W
E
 
S
I
 
I
P
 
E
T
 
T
P
 
N
S
 
I
Q
 
L
E
 
E
P
 
D
Q
 
G
E
 
K
V
 
H
I
 
I
L
 
V
S
 
P
T
 
S
I
 
I
A
 
I
D
 
E
F
 
S
I
 
I
A
 
-
S
 
-
Y
 
-
F
 
-
S
 
R
H
 
H
E
 
R
I
 
I
D
 
D
-
 
L
-
 
Y
-
 
N
-
 
M
-
 
K
-
 
K
-
 
E
-
 
D
-
 
F
-
 
V
G
 
G
I
 
I
G
 
G
I
 
M
G
 
G
I
 
T
P
 
P
G
 
G
L
 
S
V
 
V
D
 
D
A
 
I
E
 
E
K
 
K
G
 
G
I
 
T
V
 
V
Y
 
V
N
 
G
L
 
A
E
 
Y
N
 
N
I
 
L
P
 
N
A
 
W
F
 
T
N
 
T
K
 
V
V
 
Q
A
 
P
L
 
V
K
 
K
D
 
E
Y
 
Q
L
 
I
E
 
E
R
 
S
T
 
A
L
 
L
E
 
G
K
 
I
P
 
P
V
 
F
Y
 
A
I
 
L
N
 
D
N
|
N
D
 
D
A
 
A
N
|
N
C
 
V
F
 
A
A
 
A
L
 
L
G
 
G
E
 
E
Y
 
R
K
 
W
F
 
K
G
 
G
G
 
A
A
 
G
N
 
E
K
 
N
H
 
N
R
 
P
H
 
D
M
 
V
V
 
I
G
 
F
I
 
I
T
 
T
L
 
L
G
 
G
T
 
T
G
 
G
I
 
V
G
 
G
T
x
G
G
 
G
V
 
I
I
 
V
T
 
A
N
 
A
G
 
G
E
 
K
L
 
L
Y
 
L
P
 
H
G
 
G
F
 
V
L
 
A
C
 
G
G
 
C
A
 
A
G
 
G
E
 
E
W
 
V
G
 
G
G
x
H
V
 
V
P
 
T
Y
 
V
L
 
D
D
 
P
S
 
N
N
 
G
F
 
F
E
 
D
N
x
C
Y
 
T
C
|
C
S
 
G
S
 
K
K
 
R
-
 
G
-
x
C
-
 
L
-
 
E
-
 
T
-
 
V
-
 
S
-
 
S
-
 
A
-
 
T
-
 
G
F
 
V
F
 
V
R
 
R
K
 
V
L
 
A
H
 
R
H
 
H
-
 
L
-
 
S
-
 
E
-
 
E
-
 
F
-
 
A
-
 
G
-
 
D
-
 
S
-
 
E
-
 
L
-
 
K
-
 
Q
-
 
A
-
 
I
-
 
D
-
 
D
-
 
G
-
 
Q
-
 
D
T
 
V
T
 
S
A
 
S
K
 
K
K
 
D
L
 
V
A
 
F
A
 
E
K
 
F
A
 
A
A
 
E
E
 
K
G
 
G
D
 
D
Q
 
H
E
 
F
A
 
A
L
 
L
K
 
M
L
 
V
F
 
V
Y
 
D
E
 
R
Y
 
V
G
 
C
T
 
F
H
 
Y
I
 
L
G
 
G
N
 
L
L
 
A
I
 
T
K
 
G
Y
 
N
I
 
L
L
 
G
F
 
N
T
 
T
Y
 
L
A
 
N
P
 
P
E
 
D
A
 
S
I
 
V
V
 
V
I
 
I
G
 
G
G
 
G
S
 
G
I
 
V
R
 
S
K
 
A
A
 
A
F
 
G
P
 
E
Y
 
F
F
 
L
S
 
R
K
 
S
G
 
R
L
 
V
K
 
E
E
 
K
T
 
Y
V
 
F
E
 
Q
T
 
E
F
 
F
P
 
T
Y
 
F
S
 
P
S
 
Q
I
 
V
S
 
R
D
 
N
N
 
S
L
 
T
T
 
K
I
 
I
Y
 
K
T
 
L
S
 
A
S
 
E
F
 
L
-
 
G
D
 
N
D
 
E
S
 
A
A
 
G
I
 
V
M
 
I
G
 
G
A
 
A
A
 
A
A
 
S
L
 
L
V
 
A
T
 
L
E
 
Q

4db3A 1.95 angstrom resolution crystal structure of n-acetyl-d-glucosamine kinase from vibrio vulnificus.
28% identity, 95% coverage: 2:278/291 of query aligns to 5:307/311 of 4db3A

query
sites
4db3A
K
 
Q
K
 
S
N
 
N
R
 
A
L
 
M
I
 
Y
L
 
Y
G
 
G
L
 
F
D
 
D
I
 
V
G
 
G
G
 
G
T
 
T
S
 
K
I
 
I
N
 
E
A
 
F
G
 
G
I
 
A
M
 
F
K
 
N
D
 
E
G
 
K
-
 
L
E
 
E
L
 
R
I
 
V
E
 
A
K
 
T
R
 
E
E
 
R
I
 
V
P
 
P
T
 
T
P
 
P
S
 
T
Q
 
D
E
 
D
P
 
-
Q
 
Y
E
 
P
V
 
L
I
 
L
L
 
L
S
 
E
T
 
T
I
 
I
A
 
A
D
 
G
F
 
L
I
 
V
A
 
A
S
 
K
Y
 
Y
-
 
D
-
 
Q
-
 
E
F
 
F
S
 
A
H
 
C
E
 
E
I
 
-
D
 
G
G
 
K
I
 
I
G
 
G
I
 
L
G
 
G
I
 
L
P
 
P
G
 
G
L
 
M
V
 
E
D
 
D
A
 
A
E
 
D
K
 
D
G
 
A
I
 
T
V
 
V
Y
 
L
N
 
T
L
 
V
E
 
-
N
 
N
I
 
V
P
 
P
A
 
A
F
 
A
N
 
K
K
 
G
V
 
K
A
 
P
L
 
L
K
 
R
D
 
A
Y
 
D
L
 
L
E
 
E
R
 
A
T
 
K
L
 
I
E
 
G
K
 
R
P
 
S
V
 
V
Y
 
K
I
 
I
N
 
E
N
 
N
D
 
D
A
 
A
N
 
N
C
 
C
F
 
F
A
 
A
L
 
L
G
 
S
E
 
E
Y
 
A
K
 
W
F
 
D
G
 
E
G
 
E
A
 
L
N
 
Q
K
 
D
H
 
A
R
 
P
H
 
S
M
 
V
V
 
M
G
 
G
I
 
L
T
 
I
L
 
L
G
 
G
T
 
T
G
 
G
I
 
F
G
 
G
T
 
G
G
 
G
V
 
L
I
 
I
T
 
Y
N
 
E
G
 
G
E
 
K
L
 
V
Y
 
F
P
 
S
G
 
G
F
 
R
L
 
N
C
 
N
G
 
V
A
 
A
G
 
G
E
 
E
W
 
L
G
 
G
G
x
H
V
 
M
P
 
R
Y
 
L
-
 
P
L
 
L
D
 
D
S
 
A
N
 
W
F
 
F
-
 
H
-
 
L
-
 
G
-
 
D
-
 
N
-
 
A
-
 
P
-
 
L
-
 
L
-
 
G
-
x
C
-
 
G
-
x
C
-
 
G
-
 
K
-
 
K
-
 
G
-
x
C
-
 
L
E
 
D
N
 
S
Y
 
Y
C
 
L
S
 
S
S
 
G
K
 
R
F
 
G
F
 
F
R
 
E
K
 
L
L
 
L
-
 
Y
-
 
A
H
 
H
H
 
Y
T
 
Y
T
 
G
A
 
E
K
 
E
K
 
K
L
 
K
A
 
A
-
 
I
-
 
D
-
 
I
-
 
I
A
 
K
K
 
A
A
 
N
A
 
A
E
 
A
G
 
G
D
 
D
Q
 
E
E
 
K
A
 
A
L
 
A
K
 
E
L
 
H
F
 
V
Y
 
E
E
 
R
Y
 
F
G
 
M
T
 
E
H
 
L
I
 
L
G
 
A
N
 
I
L
 
C
I
 
F
K
 
G
Y
 
N
I
 
I
L
 
F
F
 
T
T
 
A
Y
 
N
A
 
D
P
 
P
E
 
H
A
 
V
I
 
V
V
 
A
I
 
L
G
 
G
G
 
G
S
 
G
I
 
L
R
 
S
K
 
N
A
 
-
F
 
F
P
 
E
Y
 
L
F
 
I
S
 
Y
K
 
E
G
 
E
L
 
M
K
 
P
E
 
K
T
 
R
V
 
V
E
 
P
T
 
K
F
 
Y
P
 
L
Y
 
L
S
 
S
S
 
V
I
 
A
S
 
K
D
 
C
N
 
P
L
 
K
T
 
I
I
 
I
Y
 
K
T
 
A
S
 
K
S
 
H
F
 
G
D
 
D
D
 
S
S
 
G
A
 
G
I
 
V
M
 
R
G
 
G
A
 
A
A
 
A
A
 
F
L
 
L

2gupA Structural genomics, the crystal structure of a rok family protein from streptococcus pneumoniae tigr4 in complex with sucrose
28% identity, 84% coverage: 7:251/291 of query aligns to 3:251/289 of 2gupA

query
sites
2gupA
I
 
I
L
 
A
G
 
T
L
 
I
D
 
D
I
 
I
G
 
G
G
 
G
T
 
T
S
 
G
I
 
I
N
 
K
-
 
F
A
 
A
G
 
S
I
 
L
M
 
T
K
 
P
D
 
D
G
 
G
E
 
K
L
 
I
I
 
L
E
 
D
K
 
K
R
 
T
E
 
S
I
 
I
P
 
S
T
 
T
P
 
P
S
 
-
Q
 
-
E
 
E
P
 
N
Q
 
L
E
 
E
V
 
D
I
 
L
L
 
L
S
 
A
T
 
W
I
 
L
A
 
D
D
 
Q
F
 
R
I
 
L
A
 
S
S
 
E
Y
 
-
F
 
-
S
 
-
H
 
Q
E
 
D
I
 
Y
D
 
S
G
 
G
I
 
I
G
 
A
I
 
M
G
 
S
I
 
V
P
 
P
G
 
G
L
 
A
V
 
V
D
 
N
A
 
Q
E
 
E
K
 
T
G
 
G
I
 
V
V
 
I
Y
 
D
N
 
G
L
 
F
E
 
S
N
 
A
I
 
V
P
 
P
A
 
Y
F
 
I
N
 
H
K
 
G
V
 
F
A
 
S
L
 
W
K
x
Y
D
 
E
Y
 
A
L
 
L
E
x
S
R
 
-
T
 
S
L
 
Y
E
x
Q
K
 
L
P
|
P
V
|
V
Y
 
H
I
 
L
N
 
E
N
 
N
D
 
D
A
 
A
N
 
N
C
 
C
F
x
V
A
 
G
L
 
L
G
 
S
E
 
E
Y
 
-
K
 
-
F
 
L
G
 
L
G
 
A
A
 
H
N
 
P
K
 
E
H
 
L
R
 
E
H
 
N
M
 
A
V
 
A
G
 
C
I
 
V
T
 
V
L
 
I
G
 
G
T
 
T
G
 
G
I
 
I
G
 
G
T
 
G
G
 
A
V
 
M
I
 
I
T
 
I
N
 
N
G
 
G
E
 
R
L
 
L
Y
 
H
P
 
R
G
 
G
F
 
R
L
 
H
C
 
G
G
 
L
A
 
G
G
 
G
E
 
E
W
 
F
G
 
G
G
 
Y
V
 
M
P
 
T
Y
 
T
L
 
L
D
 
A
-
 
P
-
 
A
-
 
E
-
 
K
-
 
L
S
 
N
N
 
N
F
 
W
E
 
S
N
 
Q
Y
 
L
C
 
A
S
 
S
S
 
T
K
 
G
-
 
N
-
 
M
-
 
V
-
 
R
-
 
Y
F
 
V
F
 
I
R
 
E
K
 
K
L
 
S
H
 
G
H
 
H
T
 
T
-
 
D
-
 
W
T
 
D
A
 
G
K
 
R
K
 
K
L
 
I
A
 
Y
A
 
Q
K
 
E
A
 
A
A
 
A
E
 
A
G
 
G
D
 
N
Q
 
I
E
 
L
A
 
C
L
 
Q
K
 
E
L
 
A
F
 
I
Y
 
E
E
 
R
Y
 
M
G
 
N
T
 
R
H
 
N
I
 
L
G
 
A
N
 
Q
L
 
G
I
 
L
K
 
L
Y
 
N
I
 
I
L
 
Q
F
 
Y
T
 
L
Y
 
I
A
 
D
P
 
P
E
 
G
A
 
V
I
 
I
V
 
S
I
 
L
G
 
G
G
|
G
S
 
S
I
 
I
R
 
S
K
 
Q
A
 
N
F
 
-
P
 
P
Y
 
D
F
 
F
S
 
I
K
 
Q
G
 
G
L
 
V
K
 
K
E
 
K
T
 
A
V
 
V
E
 
E
T
 
D
F
 
F

Sites not aligning to the query:

6jdcA Crystal structure of n-acetyl mannosmaine kinase in complex with mannac from haemophilus influenzae
25% identity, 94% coverage: 8:281/291 of query aligns to 4:267/269 of 6jdcA

query
sites
6jdcA
L
 
L
G
 
A
L
 
L
D
 
D
I
 
I
G
 
G
G
 
G
T
 
T
S
 
K
I
 
I
N
 
A
A
 
A
G
 
A
I
 
I
M
 
V
K
 
K
D
 
N
G
 
G
E
 
E
L
 
I
I
 
E
E
 
Q
K
 
R
R
 
Q
E
 
Q
I
 
I
P
 
H
T
 
T
P
 
P
S
 
R
Q
 
E
E
 
N
P
 
V
Q
 
V
E
 
E
V
 
G
I
 
M
L
 
H
S
 
Q
T
 
A
I
 
L
A
 
G
D
 
K
F
 
L
I
 
L
A
 
A
S
 
D
Y
 
Y
F
 
-
S
 
E
H
 
G
E
 
Q
I
 
F
D
 
D
G
 
Y
I
 
V
G
 
A
I
 
V
G
 
A
I
 
S
P
 
T
G
 
G
L
 
I
V
 
I
D
 
N
A
 
N
E
 
G
K
 
I
G
 
L
I
 
S
V
 
A
Y
 
L
N
 
N
L
 
P
E
 
K
N
 
N
I
 
L
P
 
G
A
 
G
F
 
L
N
 
A
K
 
E
V
 
F
A
 
P
L
 
L
K
 
K
D
 
A
Y
 
S
L
 
I
E
 
A
R
 
K
T
 
H
L
 
T
E
 
D
K
 
K
P
 
P
V
 
I
Y
 
G
I
 
L
N
 
L
N
 
N
D
 
D
A
 
A
N
 
Q
C
 
A
F
 
A
A
 
T
L
 
Y
G
 
A
E
 
E
Y
 
Y
K
 
Q
F
 
L
G
 
Q
G
 
N
A
 
F
N
 
E
K
 
Q
H
 
V
R
 
S
H
 
N
M
 
F
V
 
V
G
 
F
I
 
I
T
 
T
L
 
V
G
 
S
T
 
T
G
 
G
I
 
V
G
 
G
T
 
G
G
 
G
V
 
I
I
 
V
T
 
L
N
 
N
G
 
Q
E
 
I
L
 
L
Y
 
Q
P
 
T
-
 
G
-
 
S
-
 
R
-
 
G
-
 
I
-
 
A
-
 
G
-
 
H
-
 
I
-
 
G
-
x
H
-
 
T
-
 
L
-
 
A
-
 
D
-
 
P
-
 
N
G
 
G
F
 
A
L
 
I
C
|
C
G
 
G
A
x
C
G
 
G
E
 
R
W
 
R
G
 
G
G
x
C
V
 
V
P
 
E
Y
 
A
L
 
I
D
 
A
S
 
S
N
 
-
F
 
-
E
 
-
N
 
-
Y
 
-
C
 
-
S
 
-
S
 
-
K
 
-
F
 
-
F
 
-
R
 
-
K
 
-
L
 
-
H
 
-
H
 
-
T
 
-
T
 
-
A
 
-
K
 
-
K
 
-
L
 
-
A
 
-
A
 
G
K
 
R
A
 
A
A
 
I
E
 
E
G
 
A
D
 
V
Q
 
S
E
 
S
A
 
A
L
 
T
K
 
A
L
 
L
F
 
V
Y
 
E
E
 
R
Y
 
S
G
 
A
T
 
K
H
 
A
I
 
I
G
 
A
N
 
N
L
 
L
I
 
I
K
 
A
Y
 
D
I
 
L
L
 
V
F
 
I
T
 
S
Y
 
L
A
 
D
P
 
I
E
 
Q
A
 
K
I
 
I
V
 
A
I
 
I
G
 
G
G
 
G
S
 
S
I
 
V
R
 
G
K
 
L
A
 
A
F
 
E
P
 
G
Y
 
Y
F
 
L
S
 
S
K
 
L
G
 
-
L
 
V
K
 
E
E
 
K
T
 
Y
V
 
L
E
 
Q
T
 
D
F
 
F
P
 
P
Y
 
S
S
 
I
S
 
Y
I
 
C
S
 
C
D
 
E
N
 
-
L
 
-
T
 
-
I
 
I
Y
 
E
T
 
T
S
 
A
S
 
K
F
 
F
-
 
G
D
 
Q
D
 
D
S
 
A
A
 
G
I
 
L
M
 
I
G
 
G
A
 
A
A
 
A
A
 
Y
L
 
W
V
 
V
T
 
K
E
 
D

6jdbA Crystal structure of n-acetyl mannosmaine kinase in complex with mannac-6p and adp from haemophilus influenzae
25% identity, 94% coverage: 8:281/291 of query aligns to 4:287/290 of 6jdbA

query
sites
6jdbA
L
 
L
G
 
A
L
 
L
D
 
D
I
 
I
G
 
G
G
 
G
T
 
T
S
x
K
I
 
I
N
 
A
A
 
A
G
 
A
I
 
I
M
 
V
K
 
K
D
 
N
G
 
-
E
 
E
L
 
I
I
 
E
E
 
Q
K
 
R
R
 
Q
E
 
Q
I
 
I
P
 
H
T
 
T
P
 
P
S
 
R
Q
 
E
E
 
N
P
 
V
Q
 
V
E
 
E
V
 
G
I
 
M
L
 
H
S
 
Q
T
 
A
I
 
L
A
 
G
D
 
K
F
 
L
I
 
L
A
 
A
S
 
D
Y
 
Y
F
 
-
S
 
E
H
 
G
E
 
Q
I
 
F
D
 
D
G
 
Y
I
 
V
G
 
A
I
 
V
G
 
A
I
 
S
P
x
T
G
|
G
L
 
I
V
 
I
D
 
N
A
 
N
E
 
G
K
 
I
G
 
L
I
 
S
V
x
A
Y
x
L
N
|
N
L
 
P
E
 
K
N
|
N
I
 
L
P
 
G
A
 
G
F
 
L
N
 
A
K
 
E
V
 
F
A
 
P
L
 
L
K
 
K
D
 
A
Y
 
S
L
 
I
E
 
A
R
 
K
T
 
H
L
 
T
E
 
D
K
 
K
P
 
P
V
 
I
Y
 
G
I
 
L
N
 
L
N
|
N
D
|
D
A
 
A
N
 
Q
C
 
A
F
 
A
A
 
T
L
 
Y
G
 
A
E
 
E
Y
 
Y
K
 
Q
F
 
L
G
 
Q
G
 
N
A
 
F
N
 
E
K
 
Q
H
 
V
R
 
S
H
 
N
M
 
F
V
 
V
G
 
F
I
 
I
T
 
T
L
 
V
G
x
S
T
|
T
G
 
G
I
 
V
G
 
G
T
 
G
G
 
G
V
 
I
I
 
V
T
 
L
N
 
N
G
 
Q
E
 
I
L
 
L
Y
 
Q
P
 
T
-
 
G
-
 
S
-
 
R
-
 
G
-
 
I
-
 
A
-
 
G
-
x
H
-
 
I
-
 
G
-
x
H
-
 
T
-
 
L
-
 
A
-
 
D
-
 
P
-
 
N
G
 
G
F
 
A
L
 
I
C
|
C
G
 
G
A
x
C
G
 
G
E
 
R
W
 
R
G
 
G
G
x
C
V
 
V
P
x
E
Y
 
A
L
 
I
-
 
A
-
 
S
-
 
G
-
 
R
-
 
A
-
 
I
-
 
E
-
 
A
-
 
V
D
 
S
S
 
S
N
 
Q
F
 
W
E
 
E
N
 
D
Y
 
P
C
 
C
S
 
D
S
x
P
K
|
K
-
 
E
F
 
V
F
 
F
R
 
E
K
 
R
L
 
F
H
 
R
H
 
-
T
 
-
T
 
-
A
 
-
K
 
-
K
 
-
L
 
-
A
 
-
A
 
-
K
 
-
A
 
-
A
 
-
E
 
K
G
 
N
D
 
D
Q
 
E
E
 
K
A
 
A
L
 
T
K
 
A
L
 
L
F
 
V
Y
 
E
E
 
R
Y
 
S
G
 
A
T
 
K
H
 
A
I
 
I
G
 
A
N
 
N
L
 
L
I
 
I
K
 
A
Y
 
D
I
 
L
L
 
V
F
 
I
T
 
S
Y
 
L
A
 
D
P
 
I
E
 
Q
A
 
K
I
 
I
V
 
A
I
 
I
G
 
G
G
 
G
S
|
S
I
 
V
R
 
G
K
 
L
A
 
A
F
 
E
P
 
G
Y
 
Y
F
 
L
S
 
S
K
 
L
G
 
-
L
 
V
K
 
E
E
 
K
T
 
Y
V
 
L
E
 
Q
T
 
D
F
 
F
P
 
P
Y
 
S
S
 
I
S
 
Y
I
 
C
S
 
C
D
 
E
N
 
-
L
 
-
T
 
-
I
 
I
Y
 
E
T
 
T
S
 
A
S
 
K
F
 
F
-
 
G
D
 
Q
D
 
D
S
 
A
A
 
G
I
 
L
M
 
I
G
 
G
A
 
A
A
 
A
A
 
Y
L
 
W
V
 
V
T
 
K
E
 
D

3vglA Crystal structure of a rok family glucokinase from streptomyces griseus in complex with glucose and amppnp (see paper)
27% identity, 78% coverage: 6:233/291 of query aligns to 2:261/312 of 3vglA

query
sites
3vglA
L
 
L
I
 
T
L
 
I
G
 
G
L
 
V
D
 
D
I
 
I
G
|
G
G
 
G
T
|
T
S
x
K
I
 
I
N
 
A
A
 
A
G
 
G
I
 
V
M
 
V
-
 
D
K
 
E
D
 
E
G
 
G
E
 
R
L
 
I
I
 
L
E
 
S
K
 
T
R
 
F
E
 
K
I
 
V
P
 
A
T
 
T
P
 
P
S
 
P
Q
 
T
E
 
-
P
 
A
Q
 
E
E
 
G
V
 
I
I
 
V
L
 
D
S
 
A
T
 
I
I
 
C
A
 
A
D
 
A
F
 
V
I
 
A
A
 
G
S
 
A
Y
 
S
F
 
E
S
 
G
H
 
H
E
 
D
I
 
V
D
 
E
G
 
A
I
 
V
G
 
G
I
 
I
G
 
G
I
 
A
P
 
A
G
|
G
L
 
Y
V
 
V
D
 
D
A
 
D
E
 
K
K
 
R
G
 
A
I
 
T
V
 
V
Y
 
L
N
 
F
L
 
A
E
x
P
N
 
N
I
 
I
P
 
D
A
 
-
F
 
W
N
 
R
K
 
H
V
 
E
A
 
P
L
 
L
K
 
K
D
 
D
Y
 
K
L
 
V
E
 
E
R
 
Q
T
 
R
L
 
V
E
 
G
K
 
L
P
 
P
V
 
V
Y
 
V
I
 
V
N
 
E
N
|
N
D
|
D
A
 
A
N
 
N
C
 
A
F
 
A
A
 
A
L
 
W
G
 
G
E
 
E
Y
 
Y
K
 
R
F
 
F
G
 
G
G
 
A
A
 
G
N
 
Q
K
 
G
H
 
H
R
 
D
H
 
D
M
 
V
V
 
I
G
 
C
I
 
I
T
 
T
L
 
L
G
|
G
T
|
T
G
 
G
I
x
L
G
|
G
T
 
G
G
 
G
V
 
I
I
 
I
T
 
I
N
 
G
G
 
N
E
 
K
L
 
L
Y
 
R
-
 
R
-
 
G
-
 
R
-
 
F
-
 
G
-
 
V
-
 
A
-
 
A
-
x
E
-
 
F
-
 
G
-
x
H
-
 
I
-
 
R
-
 
V
-
 
V
-
 
P
P
 
D
G
 
G
F
 
L
L
 
L
C
|
C
G
 
G
A
x
C
G
 
G
E
 
S
W
 
Q
G
 
G
G
 
-
V
 
-
P
 
-
Y
 
-
L
 
-
D
 
-
S
 
-
N
x
C
F
 
W
E
|
E
N
 
Q
Y
 
Y
C
 
A
S
 
S
S
x
G
K
 
R
F
 
A
F
 
L
R
 
V
K
 
R
L
 
Y
H
 
A
H
 
K
T
 
Q
T
 
R
A
 
A
-
 
N
-
 
A
-
 
T
-
 
P
-
 
E
-
 
N
-
 
A
-
 
A
-
 
V
-
 
L
-
 
L
-
 
G
-
 
L
-
 
G
-
 
D
-
 
G
-
 
S
-
 
V
-
 
D
-
 
G
-
 
I
-
 
E
-
x
G
K
 
K
K
 
H
L
 
I
A
x
S
A
 
E
K
 
A
A
 
A
A
 
R
E
 
Q
G
 
G
D
 
D
Q
 
P
E
 
V
A
 
A
L
 
V
K
 
D
L
 
S
F
 
F
Y
 
R
E
 
E
Y
 
L
G
 
A
T
 
R
H
 
W
I
 
A
G
 
G
N
 
A
L
 
G
I
 
L
K
 
A
Y
 
D
I
 
L
L
 
A
F
 
S
T
 
L
Y
 
F
A
 
D
P
 
P
E
 
S
A
 
A
I
 
F
V
 
I
I
 
V
G
 
G
G
 
G
S
x
G
I
x
V

Sites not aligning to the query:

3vgkB Crystal structure of a rok family glucokinase from streptomyces griseus (see paper)
27% identity, 78% coverage: 6:233/291 of query aligns to 2:261/312 of 3vgkB

query
sites
3vgkB
L
 
L
I
 
T
L
 
I
G
 
G
L
 
V
D
 
D
I
 
I
G
 
G
G
 
G
T
 
T
S
 
K
I
 
I
N
 
A
A
 
A
G
 
G
I
 
V
M
 
V
-
 
D
K
 
E
D
 
E
G
 
G
E
 
R
L
 
I
I
 
L
E
 
S
K
 
T
R
 
F
E
 
K
I
 
V
P
 
A
T
 
T
P
 
P
S
 
P
Q
 
T
E
 
-
P
 
A
Q
 
E
E
 
G
V
 
I
I
 
V
L
 
D
S
 
A
T
 
I
I
 
C
A
 
A
D
 
A
F
 
V
I
 
A
A
 
G
S
 
A
Y
 
S
F
 
E
S
 
G
H
 
H
E
 
D
I
 
V
D
 
E
G
 
A
I
 
V
G
 
G
I
 
I
G
 
G
I
 
A
P
 
A
G
 
G
L
 
Y
V
 
V
D
 
D
A
 
D
E
 
K
K
 
R
G
 
A
I
 
T
V
 
V
Y
 
L
N
 
F
L
 
A
E
 
P
N
 
N
I
 
I
P
 
D
A
 
-
F
 
W
N
 
R
K
 
H
V
 
E
A
 
P
L
 
L
K
 
K
D
 
D
Y
 
K
L
 
V
E
 
E
R
 
Q
T
 
R
L
 
V
E
 
G
K
 
L
P
 
P
V
 
V
Y
 
V
I
 
V
N
 
E
N
 
N
D
 
D
A
 
A
N
 
N
C
 
A
F
 
A
A
 
A
L
 
W
G
 
G
E
 
E
Y
 
Y
K
 
R
F
 
F
G
 
G
G
 
A
A
 
G
N
 
Q
K
 
G
H
 
H
R
 
D
H
 
D
M
 
V
V
 
I
G
 
C
I
 
I
T
 
T
L
 
L
G
 
G
T
 
T
G
 
G
I
 
L
G
 
G
T
 
G
G
 
G
V
 
I
I
 
I
T
 
I
N
 
G
G
 
N
E
 
K
L
 
L
Y
 
R
-
 
R
-
 
G
-
 
R
-
 
F
-
 
G
-
 
V
-
 
A
-
 
A
-
 
E
-
 
F
-
 
G
-
x
H
-
 
I
-
 
R
-
 
V
-
 
V
-
 
P
P
 
D
G
 
G
F
 
L
L
 
L
C
|
C
G
 
G
A
x
C
G
 
G
E
 
S
W
 
Q
G
 
G
G
 
-
V
 
-
P
 
-
Y
 
-
L
 
-
D
 
-
S
 
-
N
x
C
F
 
W
E
 
E
N
 
Q
Y
 
Y
C
 
A
S
 
S
S
 
G
K
 
R
F
 
A
F
 
L
R
 
V
K
 
R
L
 
Y
H
 
A
H
 
K
T
 
Q
T
 
R
A
 
A
-
 
N
-
 
A
-
 
T
-
 
P
-
 
E
-
 
N
-
 
A
-
 
A
-
 
V
-
 
L
-
 
L
-
 
G
-
 
L
-
 
G
-
 
D
-
 
G
-
 
S
-
 
V
-
 
D
-
 
G
-
 
I
-
 
E
-
 
G
K
 
K
K
 
H
L
 
I
A
 
S
A
 
E
K
 
A
A
 
A
A
 
R
E
 
Q
G
 
G
D
 
D
Q
 
P
E
 
V
A
 
A
L
 
V
K
 
D
L
 
S
F
 
F
Y
 
R
E
 
E
Y
 
L
G
 
A
T
 
R
H
 
W
I
 
A
G
 
G
N
 
A
L
 
G
I
 
L
K
 
A
Y
 
D
I
 
L
L
 
A
F
 
S
T
 
L
Y
 
F
A
 
D
P
 
P
E
 
S
A
 
A
I
 
F
V
 
I
I
 
V
G
 
G
G
 
G
S
 
G
I
 
V

3vovB Crystal structure of rok hexokinase from thermus thermophilus (see paper)
32% identity, 45% coverage: 7:138/291 of query aligns to 3:134/298 of 3vovB

query
sites
3vovB
I
 
V
L
 
V
G
 
G
L
 
L
D
 
D
I
 
L
G
 
G
G
 
G
T
 
T
S
 
K
I
 
I
N
 
A
A
 
A
G
 
G
I
 
V
M
 
F
K
 
D
D
 
G
G
 
K
E
 
R
L
 
L
I
 
L
E
 
S
K
 
K
R
 
V
E
 
V
I
 
V
P
 
P
T
 
T
P
 
P
S
 
K
Q
 
E
E
 
G
P
 
G
Q
 
E
E
 
R
V
 
V
I
 
A
L
 
E
S
 
A
T
 
L
I
 
A
A
 
E
D
 
A
F
 
A
I
 
E
A
 
R
S
 
A
Y
 
E
F
 
R
S
 
E
H
 
A
E
 
G
I
 
V
D
 
R
G
 
G
-
 
E
-
 
A
I
 
I
G
 
G
I
 
L
G
 
G
I
 
T
P
 
P
G
 
G
L
 
P
V
 
L
D
 
D
A
 
F
E
 
R
K
 
R
G
 
G
I
 
V
V
 
I
Y
 
R
N
 
-
L
 
-
E
 
P
N
 
N
I
 
I
P
 
P
A
 
G
F
 
V
N
 
Q
K
 
D
V
 
F
A
 
P
L
 
I
K
 
R
D
 
R
Y
 
I
L
 
L
E
 
E
R
 
E
T
 
A
L
 
T
E
 
G
K
 
R
P
 
P
V
 
V
Y
 
F
I
 
L
N
 
E
N
 
N
D
 
D
A
 
A
N
 
N
C
 
A
F
 
A
A
 
A
L
 
L
G
 
A
E
 
E
Y
 
H
K
 
H
F
 
L
G
 
G
G
 
A
A
 
A
N
 
Q
K
 
G
H
 
E
R
 
E
H
 
S
M
 
S
V
 
L
G
 
Y
I
 
L
T
 
T
L
 
V
G
 
S
T
 
T
G
 
G
I
 
I

Sites not aligning to the query:

1xc3A Structure of a putative fructokinase from bacillus subtilis (see paper)
27% identity, 89% coverage: 6:263/291 of query aligns to 2:266/295 of 1xc3A

query
sites
1xc3A
L
 
M
I
 
L
L
 
G
G
 
G
L
 
I
D
 
E
I
 
A
G
 
G
G
 
G
T
 
T
S
 
K
I
 
F
N
 
V
A
 
C
G
 
A
I
 
V
-
 
G
M
 
R
K
 
E
D
 
D
G
 
G
E
 
T
L
 
I
I
 
I
E
 
D
K
 
R
R
 
I
E
 
E
I
 
F
P
 
P
T
 
T
P
 
-
S
 
-
Q
 
K
E
 
M
P
 
P
Q
 
D
E
 
E
V
 
T
I
 
I
L
 
E
S
 
K
T
 
V
I
 
I
A
 
-
D
 
-
F
 
-
I
 
-
A
 
-
S
 
Q
Y
 
Y
F
 
F
S
 
S
H
 
Q
-
 
F
E
 
S
I
 
L
D
 
Q
G
 
A
I
 
I
G
 
G
I
 
I
G
 
G
I
 
S
P
 
F
G
 
G
L
 
P
V
 
V
D
 
D
A
 
N
E
 
D
K
 
K
G
 
-
I
 
T
V
 
S
Y
 
Q
N
 
T
L
 
Y
E
 
G
N
 
T
I
 
I
P
 
T
A
 
A
F
 
T
N
 
P
K
 
K
V
 
A
A
 
G
L
 
W
K
 
R
D
 
H
Y
 
Y
-
 
P
-
 
F
-
 
L
-
 
Q
-
 
T
L
 
V
E
 
K
R
 
N
T
 
E
L
 
M
E
 
K
K
 
I
P
 
P
V
 
V
Y
 
G
I
 
F
N
 
S
N
 
T
D
 
D
A
 
V
N
 
N
C
 
A
F
 
A
A
 
A
L
 
L
G
 
G
E
 
E
Y
 
F
K
 
L
F
 
F
G
 
G
G
 
E
A
 
A
N
 
K
K
 
G
H
 
L
R
 
D
H
 
S
M
 
C
V
 
L
G
 
Y
I
 
I
T
 
T
L
 
I
G
 
G
T
 
T
G
 
G
I
 
I
G
 
G
T
 
A
G
 
G
V
 
A
I
 
I
T
 
V
N
 
E
G
 
G
E
 
R
L
 
L
Y
 
L
P
 
Q
G
 
G
F
 
L
L
 
-
C
 
-
G
 
S
A
 
H
G
 
P
E
 
E
W
 
M
G
 
G
G
x
H
V
 
I
-
 
Y
-
 
I
-
 
R
P
 
R
Y
 
H
L
 
P
D
 
D
S
 
D
N
 
V
F
 
Y
E
 
Q
N
 
G
Y
 
K
C
|
C
S
 
P
-
 
Y
-
x
H
S
 
G
K
 
D
F
x
C
F
 
F
R
 
E
K
 
G
L
 
L
H
 
A
H
 
S
T
 
G
T
 
P
A
 
A
K
 
I
K
 
E
L
 
A
A
 
R
A
 
W
K
 
G
A
 
K
A
 
K
E
 
A
G
 
A
D
 
D
Q
 
L
E
 
S
A
 
D
L
 
I
K
 
A
L
 
Q
F
 
V
Y
 
W
E
 
E
Y
 
L
-
 
E
G
 
G
T
 
Y
H
 
Y
I
 
I
G
 
A
N
 
Q
L
 
A
I
 
L
K
 
A
Y
 
Q
I
 
Y
L
 
I
F
 
L
T
 
I
Y
 
L
A
 
A
P
 
P
E
 
K
A
 
K
I
 
I
V
 
I
I
 
L
G
 
G
G
 
G
S
 
G
I
 
V
-
 
M
-
 
Q
-
 
Q
R
 
K
K
 
Q
A
 
V
F
 
F
P
 
S
Y
 
Y
F
 
I
S
 
Y
K
 
Q
G
 
Y
L
 
V
K
 
P
E
 
K
T
 
I
V
 
M
E
 
N
T
 
S
F
 
Y
-
 
L
P
 
D
Y
 
F
S
 
S
S
 
E
I
 
L
S
 
S
D
 
D
N
 
D
L
 
I
T
 
S
I
 
D
Y
 
Y

Query Sequence

>Echvi_3894 FitnessBrowser__Cola:Echvi_3894
MKKNRLILGLDIGGTSINAGIMKDGELIEKREIPTPSQEPQEVILSTIADFIASYFSHEI
DGIGIGIPGLVDAEKGIVYNLENIPAFNKVALKDYLERTLEKPVYINNDANCFALGEYKF
GGANKHRHMVGITLGTGIGTGVITNGELYPGFLCGAGEWGGVPYLDSNFENYCSSKFFRK
LHHTTAKKLAAKAAEGDQEALKLFYEYGTHIGNLIKYILFTYAPEAIVIGGSIRKAFPYF
SKGLKETVETFPYSSISDNLTIYTSSFDDSAIMGAAALVTEAESHVANLAK

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory