SitesBLAST – Find functional sites

 

SitesBLAST

Comparing AO356_00970 AO356_00970 LacI family transcriptional regulator to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

5dteB Crystal structure of an abc transporter periplasmic solute binding protein (ipr025997) from actinobacillus succinogenes 130z(asuc_0081, target efi-511065) with bound d-allose
39% identity, 85% coverage: 33:303/319 of query aligns to 1:270/287 of 5dteB

query
sites
5dteB
E
 
D
K
 
K
P
 
P
K
 
Q
V
 
I
A
 
A
L
 
L
V
 
L
M
 
M
K
|
K
S
 
T
L
 
L
A
 
S
N
|
N
E
 
E
F
x
Y
F
 
F
L
 
I
T
 
S
M
 
M
E
 
R
D
 
Q
G
 
G
A
 
A
K
 
E
A
 
E
Y
 
T
Q
 
A
K
 
K
E
 
Q
H
 
K
S
 
-
A
 
-
D
 
D
F
 
I
D
 
D
L
 
L
I
 
I
S
 
V
N
 
Q
G
 
V
I
 
A
K
 
E
D
 
K
E
 
E
T
 
D
D
 
S
T
 
T
A
 
E
N
 
Q
Q
 
L
I
 
V
R
 
G
I
 
L
V
 
V
E
 
E
Q
 
N
M
 
M
I
 
I
V
 
A
S
 
K
K
 
K
V
 
V
D
 
D
A
 
A
L
 
I
I
 
I
I
 
V
A
 
T
P
 
P
A
 
N
D
 
D
S
 
S
K
 
I
A
 
A
M
 
F
V
 
I
P
 
P
V
 
A
I
 
F
K
 
Q
K
 
K
A
 
A
V
 
E
D
 
K
A
 
A
G
 
G
I
 
I
T
 
P
V
 
I
I
 
I
N
 
D
I
 
L
D
|
D
N
 
V
Q
 
R
L
 
L
D
 
D
P
 
A
A
 
K
V
 
A
V
 
A
K
 
E
S
 
A
K
 
A
N
 
G
I
 
L
N
 
K
V
 
F
P
 
N
F
 
Y
V
 
V
G
 
G
P
 
V
D
 
D
N
 
N
R
 
F
K
 
N
G
 
G
A
 
G
R
 
Y
L
 
L
V
 
E
G
 
A
E
 
K
Y
 
N
L
 
L
A
 
A
K
 
E
Q
 
A
L
 
I
K
 
G
A
 
K
G
 
K
D
 
G
E
 
N
V
 
V
G
 
A
I
 
I
I
 
L
E
 
E
G
 
G
V
 
I
S
 
P
T
 
G
T
 
V
T
 
D
N
|
N
A
 
G
Q
 
E
A
 
Q
R
|
R
T
 
K
A
 
G
G
 
G
-
 
A
F
 
L
K
 
K
D
 
A
A
 
F
M
 
A
E
 
E
A
 
Y
A
 
P
Q
 
D
V
 
I
K
 
K
V
 
I
V
 
V
S
 
A
L
 
S
Q
 
Q
S
 
S
G
 
A
D
 
N
W
|
W
E
 
E
I
 
T
N
 
E
K
 
Q
G
 
A
N
 
L
Q
 
N
V
 
V
A
 
T
A
 
T
S
 
N
M
 
I
L
 
L
S
 
T
E
 
A
Y
 
N
P
 
P
N
 
N
I
 
I
K
 
N
A
 
G
L
 
I
L
 
F
A
 
A
G
 
A
N
 
N
D
 
D
S
 
N
M
 
M
A
 
A
V
 
I
G
 
G
A
 
A
V
 
V
S
 
T
A
 
A
V
 
V
R
 
E
A
 
N
A
 
A
G
 
G
K
 
L
A
 
A
G
 
G
K
 
K
V
 
V
Q
 
L
V
 
V
V
 
S
G
 
G
Y
 
Y
D
|
D
N
 
G
I
 
I
N
 
P
A
 
L
I
 
A
K
 
I
P
 
E
M
 
Y
L
 
V
K
 
K
D
 
Q
G
 
G
R
 
K
V
 
M
L
 
Q
A
 
N
T
 
T
A
 
I
D
 
D
Q
|
Q
F
 
L
A
 
P
A
 
K
K
 
K
Q
 
Q
A
 
V
V
 
A
F
 
I
G
 
A
I
 
I
E
 
E
T
 
H
A
 
A
L
 
L
K
 
K
M
 
Q
L
 
I
K
 
N
G
 
K
E
 
Q
K
 
E
V
 
I
D
 
P
S
 
S

2ioyA Crystal structure of thermoanaerobacter tengcongensis ribose binding protein (see paper)
35% identity, 88% coverage: 37:318/319 of query aligns to 3:270/274 of 2ioyA

query
sites
2ioyA
V
 
I
A
 
G
L
 
L
V
 
V
M
 
I
K
 
S
S
 
T
L
 
L
A
 
N
N
|
N
E
 
P
F
|
F
F
|
F
L
 
V
T
 
T
M
 
L
E
 
K
D
 
N
G
 
G
A
 
A
K
 
E
A
 
E
Y
 
K
Q
 
A
K
 
K
E
 
E
H
 
L
S
 
G
A
 
-
D
 
-
F
 
Y
D
 
K
L
 
I
I
 
I
S
 
-
N
 
-
G
 
-
I
 
V
K
 
E
D
 
D
-
 
S
E
 
Q
T
 
N
D
 
D
T
 
S
A
 
S
N
 
K
Q
 
E
I
 
L
R
 
S
I
 
N
V
 
V
E
 
E
Q
 
D
M
 
L
I
 
I
V
 
Q
S
 
Q
K
 
K
V
 
V
D
 
D
A
 
V
L
 
L
I
 
L
I
 
I
A
 
N
P
 
P
A
 
V
D
 
D
S
 
S
K
 
D
A
 
A
M
 
V
V
 
V
P
 
T
V
 
A
I
 
I
K
 
K
K
 
E
A
 
A
V
 
N
D
 
S
A
 
K
G
 
N
I
 
I
T
 
P
V
 
V
I
 
I
N
 
T
I
 
I
D
|
D
N
x
R
Q
 
S
L
 
A
D
 
N
P
 
G
A
 
G
V
 
D
V
 
V
K
 
-
S
 
-
K
 
-
N
 
-
I
 
-
N
 
-
V
 
V
P
 
C
F
 
H
V
 
I
G
 
A
P
 
S
D
 
D
N
 
N
R
 
V
K
 
K
G
 
G
A
 
G
R
 
E
L
 
M
V
 
A
G
 
A
E
 
E
Y
 
F
L
 
I
A
 
A
K
 
K
Q
 
A
L
 
L
K
 
K
A
 
G
G
 
K
D
 
G
E
 
N
V
 
V
G
 
V
I
 
E
I
 
L
E
 
E
G
 
G
V
 
I
S
 
P
T
 
G
T
 
A
T
 
S
N
x
A
A
 
A
Q
 
R
A
 
D
R
|
R
T
 
G
A
 
K
G
 
G
F
 
F
K
 
D
D
 
E
A
 
A
M
 
I
-
 
A
E
 
K
A
 
Y
A
 
P
Q
 
D
V
 
I
K
 
K
V
 
I
V
 
V
S
 
A
L
 
K
Q
 
Q
S
 
A
G
 
A
D
 
D
W
x
F
E
 
D
I
 
R
N
 
S
K
 
K
G
 
G
N
 
L
Q
 
S
V
 
V
A
 
M
A
 
E
S
 
N
M
 
I
L
 
L
S
 
Q
E
 
A
Y
 
Q
P
 
P
N
 
K
I
 
I
K
 
D
A
 
A
L
 
V
L
 
F
A
 
A
G
 
Q
N
|
N
D
 
D
S
 
E
M
 
M
A
 
A
V
 
L
G
 
G
A
 
A
V
 
I
S
 
K
A
 
A
V
 
I
R
 
E
A
 
A
A
 
A
G
 
N
K
 
R
A
 
Q
G
 
G
K
 
-
V
 
I
Q
 
I
V
 
V
V
 
V
G
 
G
Y
 
F
D
|
D
N
 
G
I
 
T
N
 
E
A
 
D
I
 
A
K
 
L
P
 
K
M
 
A
L
 
I
K
 
K
D
 
E
G
 
G
R
 
K
V
 
M
L
 
A
A
 
A
T
 
T
A
 
I
D
 
A
Q
|
Q
F
 
Q
A
 
P
A
 
A
K
 
L
Q
 
M
A
 
G
V
 
S
F
 
L
G
 
G
I
 
V
E
 
E
T
 
M
A
 
A
L
 
D
K
 
K
M
 
Y
L
 
L
K
 
K
G
 
G
E
 
E
K
 
K
V
 
I
D
 
P
S
 
N
G
 
-
T
 
-
N
 
-
G
 
-
V
 
F
I
 
I
E
 
P
T
 
A
P
 
E
V
 
L
E
 
K
L
 
L
V
 
I
T
 
T
K
 
K

1dbpA Identical mutations at corresponding positions in two homologous proteins with non-identical effects (see paper)
34% identity, 88% coverage: 34:315/319 of query aligns to 1:265/271 of 1dbpA

query
sites
1dbpA
K
 
K
P
 
D
K
 
T
V
 
I
A
 
A
L
 
L
V
 
V
M
 
V
K
 
S
S
 
T
L
 
L
A
 
N
N
|
N
E
 
P
F
|
F
F
 
F
L
 
V
T
 
S
M
 
L
E
 
K
D
 
D
G
 
G
A
 
A
K
 
-
A
 
-
Y
 
-
Q
 
Q
K
 
K
E
 
E
-
 
A
H
 
D
S
 
K
A
 
L
D
 
G
F
 
Y
D
 
N
L
 
L
I
 
V
S
 
V
N
 
-
G
 
-
I
 
L
K
 
D
D
 
S
E
 
Q
T
 
N
D
 
N
T
 
P
A
 
A
N
 
K
Q
 
E
I
 
L
R
 
A
I
 
N
V
 
V
E
 
Q
Q
 
D
M
 
L
I
 
T
V
 
V
S
 
R
K
 
G
V
 
T
D
 
K
A
 
I
L
 
L
I
 
L
I
 
I
A
 
N
P
 
P
A
 
T
D
 
D
S
 
S
K
 
D
A
 
A
M
 
V
V
 
D
P
 
N
V
 
A
I
 
V
K
 
K
K
 
M
A
 
A
V
 
N
D
 
Q
A
 
A
G
 
N
I
 
I
T
 
P
V
 
V
I
 
I
N
 
T
I
 
L
D
|
D
N
x
R
Q
 
Q
L
 
-
D
 
-
P
 
-
A
 
-
V
 
-
V
 
-
K
 
A
S
 
T
K
 
K
N
 
G
I
 
E
N
 
V
V
 
V
P
 
S
F
 
H
V
 
I
G
 
A
P
 
S
D
 
D
N
 
N
R
 
V
K
 
L
G
 
G
A
 
G
R
 
K
L
 
I
V
 
A
G
 
G
E
 
D
Y
 
Y
L
 
I
A
 
A
K
 
K
Q
 
K
L
 
A
K
 
G
A
 
E
G
 
G
D
 
A
E
 
K
V
 
V
G
 
I
I
 
E
I
 
L
E
 
Q
G
 
G
V
 
I
S
 
A
T
 
G
T
 
T
T
 
S
N
 
A
A
 
A
Q
 
R
A
 
E
R
|
R
T
 
G
A
 
E
G
 
G
F
 
F
K
 
Q
D
 
Q
A
 
A
M
 
V
E
 
A
A
 
A
A
 
H
Q
 
K
V
 
F
K
 
N
V
 
V
V
 
L
S
 
A
L
 
S
Q
 
Q
S
 
P
G
 
A
D
 
D
W
x
F
E
 
D
I
 
R
N
 
I
K
 
K
G
 
G
N
 
L
Q
 
N
V
 
V
A
 
M
A
 
Q
S
 
N
M
 
L
L
 
L
S
 
T
E
 
A
Y
 
H
P
 
P
N
 
D
I
 
V
K
 
Q
A
 
A
L
 
V
L
 
F
A
 
A
G
 
Q
N
|
N
D
 
D
S
 
E
M
 
M
A
 
A
V
 
L
G
 
G
A
 
A
V
 
L
S
 
R
A
 
A
V
 
L
R
 
Q
A
 
T
A
 
A
G
 
G
K
 
K
A
 
S
G
 
-
K
 
D
V
 
V
Q
 
M
V
 
V
V
 
V
G
 
G
Y
 
F
D
|
D
N
 
G
I
 
T
N
 
P
A
 
D
I
 
G
K
 
E
P
 
K
M
 
A
L
 
V
K
 
N
D
 
D
G
 
G
R
 
K
V
 
L
L
 
A
A
 
A
T
 
T
A
 
I
D
 
A
Q
 
Q
F
 
L
A
 
P
A
 
D
K
 
Q
Q
 
I
A
 
G
V
 
A
F
 
K
G
 
G
I
 
V
E
 
E
T
 
T
A
 
A
L
 
D
K
 
K
M
 
V
L
 
L
K
 
K
G
 
G
E
 
E
K
 
K
V
 
V
D
 
Q
S
 
A
G
 
-
T
 
-
N
 
-
G
 
-
V
 
-
I
 
-
E
 
K
T
 
Y
P
 
P
V
 
V
E
 
D
L
 
L

4zjpA Structure of an abc-transporter solute binding protein (sbp_ipr025997) from actinobacillus succinogenes (asuc_0197, target efi-511067) with bound beta-d-ribopyranose
34% identity, 84% coverage: 37:303/319 of query aligns to 5:259/270 of 4zjpA

query
sites
4zjpA
V
 
I
A
 
A
L
 
L
V
 
T
M
 
V
K
 
S
S
 
T
L
 
L
A
 
D
N
|
N
E
 
P
F
|
F
F
|
F
L
 
V
T
 
S
M
 
L
E
 
K
D
 
D
G
 
G
A
 
A
K
 
Q
A
 
-
Y
 
-
Q
 
K
K
 
K
E
 
A
H
 
T
S
 
E
A
 
L
D
 
G
F
 
Y
D
 
K
L
 
L
I
 
V
S
 
V
N
 
-
G
 
-
I
 
L
K
 
D
D
 
S
E
 
Q
T
 
N
D
 
D
T
 
P
A
 
S
N
 
K
Q
 
E
I
 
L
R
 
S
I
 
N
V
 
V
E
 
E
Q
 
D
M
 
L
I
 
T
V
 
V
S
 
R
K
 
G
V
 
A
D
 
K
A
 
V
L
 
L
I
 
L
I
 
I
A
 
N
P
 
P
A
 
T
D
 
D
S
 
S
K
 
A
A
 
A
M
 
V
V
 
S
P
 
N
V
 
A
I
 
V
K
 
A
K
 
I
A
 
A
V
 
N
D
 
R
A
 
N
G
 
K
I
 
I
T
 
P
V
 
V
I
 
I
N
 
T
I
 
L
D
|
D
N
x
R
Q
 
G
L
 
-
D
 
-
P
 
-
A
 
-
V
 
-
V
 
-
K
 
A
S
 
A
K
 
K
N
 
G
I
 
E
N
 
V
V
 
V
P
 
S
F
 
H
V
 
I
G
 
A
P
 
S
D
 
D
N
 
N
R
 
V
K
 
A
G
 
G
A
 
G
R
 
K
L
 
M
V
 
A
G
 
G
E
 
D
Y
 
F
L
 
I
A
 
A
K
 
Q
Q
 
K
L
 
L
K
 
G
A
 
D
G
 
G
D
 
A
E
 
K
V
 
V
G
 
I
I
 
Q
I
 
L
E
 
E
G
 
G
V
 
L
S
 
A
T
 
G
T
 
T
T
 
S
N
 
A
A
 
A
Q
 
R
A
 
E
R
|
R
T
 
G
A
 
E
G
 
G
F
 
F
K
 
K
D
 
Q
A
 
A
M
 
I
E
 
E
A
 
A
A
 
H
Q
 
K
V
 
F
K
 
D
V
 
V
V
 
L
S
 
A
L
 
S
Q
 
Q
S
 
P
G
 
A
D
 
D
W
x
F
E
 
D
I
 
R
N
 
T
K
 
K
G
 
G
N
 
L
Q
 
N
V
 
V
A
 
T
A
 
E
S
 
N
M
 
L
L
 
L
S
 
A
E
 
S
Y
 
K
P
 
G
N
 
S
I
 
V
K
 
Q
A
 
A
L
 
I
L
 
F
A
 
A
G
 
Q
N
|
N
D
 
D
S
 
E
M
 
M
A
 
A
V
 
L
G
 
G
A
 
A
V
 
L
S
 
R
A
 
A
V
 
I
R
 
S
A
 
A
A
 
A
G
 
G
K
 
K
A
 
-
G
 
-
K
 
K
V
 
V
Q
 
L
V
 
V
V
 
V
G
 
G
Y
 
F
D
|
D
N
 
G
I
 
T
N
 
E
A
 
D
I
 
G
K
 
V
P
 
K
M
 
A
L
 
V
K
 
K
D
 
S
G
 
G
R
 
K
V
 
L
L
 
A
A
 
A
T
 
T
A
 
V
D
 
A
Q
|
Q
F
 
Q
A
 
P
A
 
E
K
 
L
Q
 
I
A
 
G
V
 
S
F
 
L
G
 
G
I
 
V
E
 
E
T
 
T
A
 
A
L
 
D
K
 
K
M
 
I
L
 
L
K
 
K
G
 
G
E
 
E
K
 
K
V
 
V
D
 
D
S
 
A

1rpjA Crystal structure of d-allose binding protein from escherichia coli (see paper)
33% identity, 83% coverage: 38:301/319 of query aligns to 5:269/288 of 1rpjA

query
sites
1rpjA
A
 
A
L
 
V
V
 
V
M
 
L
K
|
K
S
 
T
L
 
L
A
 
S
N
|
N
E
 
P
F
|
F
F
 
W
L
 
V
T
 
D
M
 
M
E
 
K
D
 
K
G
 
G
A
 
I
K
 
E
A
 
D
Y
 
E
Q
 
A
K
 
K
E
 
T
H
 
L
S
 
G
A
 
V
D
 
S
F
 
V
D
 
D
L
 
I
I
 
F
S
 
A
N
 
S
G
 
-
I
 
-
K
 
P
D
 
S
E
|
E
T
 
G
D
 
D
T
 
F
A
 
Q
N
 
S
Q
 
Q
I
 
L
R
 
Q
I
 
L
V
 
F
E
 
E
Q
 
D
M
 
L
I
 
S
V
 
N
S
 
K
K
 
N
V
 
Y
D
 
K
A
 
G
L
 
I
I
 
A
I
 
F
A
 
A
P
 
P
A
 
L
D
 
S
S
 
S
K
 
V
A
 
N
M
 
L
V
 
V
P
 
M
V
 
P
I
 
V
K
 
A
K
 
R
A
 
A
V
 
W
D
 
K
A
 
K
G
 
G
I
 
I
T
 
Y
V
 
L
I
 
V
N
 
N
I
 
L
D
|
D
N
 
E
Q
 
K
L
 
I
D
 
D
P
 
M
A
 
D
V
 
N
V
 
L
K
 
K
S
 
K
K
 
A
N
 
G
I
 
G
N
 
N
V
 
V
P
 
E
-
 
A
F
 
F
V
 
V
G
 
T
P
 
T
D
 
D
N
 
N
-
 
V
-
 
A
-
 
V
-
 
G
R
 
A
K
 
K
G
 
G
A
 
A
R
 
S
L
 
F
V
 
I
G
 
I
E
 
D
Y
 
K
L
 
L
A
 
G
K
 
A
Q
 
E
L
 
-
K
 
-
A
 
-
G
 
G
D
 
G
E
 
E
V
 
V
G
 
A
I
 
I
I
 
I
E
 
E
G
 
G
V
 
K
S
 
A
T
 
G
T
 
N
T
 
A
N
x
S
A
 
G
Q
 
E
A
 
A
R
|
R
T
 
R
A
 
N
G
 
G
F
 
A
K
 
T
D
 
E
A
 
A
M
 
F
E
 
K
-
 
K
A
 
A
A
 
S
Q
 
Q
V
 
I
K
 
K
V
 
L
V
 
V
S
 
A
L
 
S
Q
 
Q
S
 
P
G
 
A
D
 
D
W
|
W
E
 
D
I
 
R
N
 
I
K
 
K
G
 
A
N
 
L
Q
 
D
V
 
V
A
 
A
A
 
T
S
 
N
M
 
V
L
 
L
S
 
Q
E
 
R
Y
 
N
P
 
P
N
 
N
I
 
I
K
 
K
A
 
A
L
 
I
L
 
Y
A
 
C
G
 
A
N
|
N
D
 
D
S
 
T
M
 
M
A
 
A
V
 
M
G
 
G
A
 
V
V
 
A
S
 
Q
A
 
A
V
 
V
R
 
A
A
 
N
A
 
A
G
 
G
K
 
K
A
 
T
G
 
G
K
 
K
V
 
V
Q
 
L
V
 
V
V
 
V
G
 
G
Y
 
T
D
|
D
N
 
G
I
 
I
N
 
P
A
 
E
I
 
A
K
 
R
P
 
K
M
 
M
L
 
V
K
 
E
D
 
A
G
 
G
R
 
Q
V
 
M
L
 
T
A
 
A
T
 
T
A
 
V
D
 
A
Q
|
Q
F
 
N
A
 
P
A
 
A
K
 
D
Q
 
I
A
 
G
V
 
A
F
 
T
G
 
G
I
 
L
E
 
K
T
 
L
A
 
M
L
 
V
K
 
D
M
 
A
L
 
E
K
 
K
G
 
S
E
 
G
K
 
K
V
 
V

1gudA Hinge-bending motion of d-allose binding protein from escherichia coli: three open conformations (see paper)
33% identity, 83% coverage: 38:301/319 of query aligns to 5:269/288 of 1gudA

query
sites
1gudA
A
 
A
L
 
V
V
 
V
M
 
L
K
 
K
S
 
T
L
 
L
A
 
S
N
 
N
E
 
P
F
 
F
F
 
W
L
 
V
T
 
D
M
 
M
E
 
K
D
 
K
G
 
G
A
 
I
K
 
E
A
 
D
Y
 
E
Q
 
A
K
 
K
E
 
T
H
 
L
S
 
G
A
 
V
D
 
S
F
 
V
D
|
D
L
 
I
I
 
F
S
 
A
N
 
S
G
 
-
I
 
-
K
 
P
D
 
S
E
 
E
T
 
G
D
 
D
T
 
F
A
 
Q
N
 
S
Q
 
Q
I
 
L
R
 
Q
I
 
L
V
 
F
E
 
E
Q
 
D
M
 
L
I
 
S
V
 
N
S
 
K
K
 
N
V
 
Y
D
 
K
A
 
G
L
 
I
I
 
A
I
 
F
A
 
A
P
 
P
A
 
L
D
 
S
S
 
S
K
 
V
A
 
N
M
 
L
V
 
V
P
 
M
V
 
P
I
 
V
K
 
A
K
 
R
A
 
A
V
 
W
D
 
K
A
 
K
G
 
G
I
 
I
T
 
Y
V
 
L
I
 
V
N
 
N
I
 
L
D
 
D
N
 
E
Q
 
K
L
 
I
D
 
D
P
 
M
A
 
D
V
 
N
V
 
L
K
 
K
S
 
K
K
 
A
N
 
G
I
 
G
N
 
N
V
 
V
P
 
E
-
 
A
F
 
F
V
 
V
G
 
T
P
 
T
D
 
D
N
 
N
-
 
V
-
 
A
-
 
V
-
 
G
R
 
A
K
 
K
G
 
G
A
 
A
R
 
S
L
 
F
V
 
I
G
 
I
E
 
D
Y
 
K
L
 
L
A
 
G
K
 
A
Q
 
E
L
 
-
K
 
-
A
 
-
G
 
G
D
 
G
E
 
E
V
 
V
G
 
A
I
 
I
I
 
I
E
 
E
G
 
G
V
 
K
S
 
A
T
 
G
T
 
N
T
 
A
N
 
S
A
 
G
Q
 
E
A
 
A
R
 
R
T
 
R
A
 
N
G
 
G
F
 
A
K
 
T
D
 
E
A
 
A
M
 
F
E
 
K
-
 
K
A
 
A
A
 
S
Q
 
Q
V
 
I
K
 
K
V
 
L
V
 
V
S
 
A
L
 
S
Q
 
Q
S
 
P
G
 
A
D
 
D
W
 
W
E
 
D
I
 
R
N
 
I
K
 
K
G
 
A
N
 
L
Q
 
D
V
 
V
A
 
A
A
 
T
S
 
N
M
 
V
L
 
L
S
 
Q
E
 
R
Y
 
N
P
 
P
N
 
N
I
 
I
K
 
K
A
 
A
L
 
I
L
 
Y
A
 
C
G
 
A
N
 
N
D
 
D
S
 
T
M
 
M
A
 
A
V
 
M
G
 
G
A
 
V
V
 
A
S
 
Q
A
 
A
V
 
V
R
 
A
A
 
N
A
 
A
G
 
G
K
 
K
A
 
T
G
 
G
K
 
K
V
 
V
Q
 
L
V
 
V
V
 
V
G
 
G
Y
 
T
D
 
D
N
 
G
I
 
I
N
 
P
A
 
E
I
 
A
K
 
R
P
 
K
M
 
M
L
 
V
K
 
E
D
 
A
G
 
G
R
 
Q
V
 
M
L
 
T
A
 
A
T
 
T
A
 
V
D
 
A
Q
 
Q
F
 
N
A
 
P
A
 
A
K
 
D
Q
 
I
A
 
G
V
 
A
F
 
T
G
 
G
I
 
L
E
 
K
T
 
L
A
 
M
L
 
V
K
 
D
M
 
A
L
 
E
K
 
K
G
 
S
E
 
G
K
 
K
V
 
V

Sites not aligning to the query:

8wlbA X-ray structure of enterobacter cloacae allose-binding protein in complex with d-psicose (see paper)
33% identity, 83% coverage: 38:301/319 of query aligns to 5:269/288 of 8wlbA

query
sites
8wlbA
A
 
A
L
 
V
V
 
V
M
 
L
K
|
K
S
 
T
L
 
L
A
 
S
N
|
N
E
 
P
F
|
F
F
x
W
L
 
V
T
 
D
M
 
M
E
 
K
D
 
K
G
 
G
A
 
I
K
 
E
A
 
D
Y
 
E
Q
 
A
K
 
K
E
 
T
H
 
L
S
 
G
A
 
V
D
 
S
F
 
V
D
 
D
L
 
I
I
 
F
S
 
A
N
 
S
G
 
-
I
 
-
K
 
P
D
 
S
E
 
E
T
 
G
D
 
D
T
 
F
A
 
Q
N
 
S
Q
 
Q
I
 
L
R
 
Q
I
 
L
V
 
F
E
 
E
Q
 
D
M
 
L
I
 
S
V
 
N
S
 
K
K
 
K
V
 
Y
D
 
K
A
 
G
L
 
I
I
 
A
I
 
F
A
 
A
P
 
P
A
 
L
D
 
S
S
 
S
K
 
V
A
 
N
M
 
L
V
 
V
P
 
M
V
 
P
I
 
V
K
 
A
K
 
R
A
 
A
V
 
W
D
 
Q
A
 
K
G
 
G
I
 
L
T
 
Y
V
 
L
I
 
V
N
 
N
I
 
L
D
|
D
N
x
E
Q
 
K
L
 
I
D
 
D
P
 
M
A
 
D
V
 
N
V
 
L
K
 
K
S
 
K
K
 
A
N
 
G
I
 
G
N
 
N
V
 
V
P
 
E
-
 
G
F
 
F
V
 
V
G
 
T
P
 
T
D
 
D
N
 
N
-
 
V
-
 
A
-
 
V
-
 
G
R
 
A
K
 
K
G
 
G
A
 
A
R
 
D
L
 
F
V
 
I
G
 
I
E
 
N
Y
 
K
L
 
L
A
 
G
K
 
A
Q
 
E
L
 
-
K
 
-
A
 
-
G
 
G
D
 
G
E
 
E
V
 
V
G
 
A
I
 
I
I
 
I
E
 
E
G
 
G
V
 
K
S
 
A
T
 
G
T
 
N
T
 
A
N
x
S
A
 
G
Q
 
E
A
 
A
R
|
R
T
 
R
A
 
N
G
 
G
F
 
A
K
 
T
D
 
E
A
 
A
M
 
F
E
 
K
A
 
K
A
 
A
-
 
N
Q
 
Q
V
 
I
K
 
K
V
 
L
V
 
V
S
 
A
L
 
S
Q
 
Q
S
 
P
G
 
A
D
 
D
W
 
W
E
 
D
I
 
R
N
 
I
K
 
K
G
 
A
N
 
L
Q
 
D
V
 
V
A
 
A
A
 
T
S
 
N
M
 
V
L
 
L
S
 
Q
E
 
R
Y
 
N
P
 
P
N
 
N
I
 
L
K
 
K
A
 
A
L
 
F
L
 
Y
A
 
C
G
 
A
N
|
N
D
 
D
S
 
T
M
 
M
A
 
A
V
 
M
G
 
G
A
 
V
V
 
A
S
 
Q
A
 
A
V
 
V
R
 
A
A
 
N
A
 
A
G
 
G
K
 
K
A
 
I
G
 
G
K
 
K
V
 
V
Q
 
L
V
 
V
V
 
V
G
 
G
Y
 
T
D
|
D
N
 
G
I
 
I
N
 
P
A
 
E
I
 
A
K
 
R
P
 
K
M
 
M
L
 
V
K
 
E
D
 
A
G
 
G
R
 
Q
V
 
M
L
 
T
A
 
A
T
 
T
A
 
V
D
 
A
Q
|
Q
F
 
N
A
 
P
A
 
A
K
 
D
Q
 
I
A
 
G
V
 
A
F
 
T
G
 
G
I
 
L
E
 
K
T
 
L
A
 
M
L
 
V
K
 
D
M
 
A
L
 
A
K
 
K
G
 
T
E
 
G
K
 
K
V
 
V

8wl9A X-ray structure of enterobacter cloacae allose-binding protein in complex with d-ribose (see paper)
33% identity, 83% coverage: 38:301/319 of query aligns to 5:269/288 of 8wl9A

query
sites
8wl9A
A
 
A
L
 
V
V
 
V
M
 
L
K
 
K
S
 
T
L
 
L
A
 
S
N
|
N
E
 
P
F
|
F
F
 
W
L
 
V
T
 
D
M
 
M
E
 
K
D
 
K
G
 
G
A
 
I
K
 
E
A
 
D
Y
 
E
Q
 
A
K
 
K
E
 
T
H
 
L
S
 
G
A
 
V
D
 
S
F
 
V
D
 
D
L
 
I
I
 
F
S
 
A
N
 
S
G
 
-
I
 
-
K
 
P
D
 
S
E
 
E
T
 
G
D
 
D
T
 
F
A
 
Q
N
 
S
Q
 
Q
I
 
L
R
 
Q
I
 
L
V
 
F
E
 
E
Q
 
D
M
 
L
I
 
S
V
 
N
S
 
K
K
 
K
V
 
Y
D
 
K
A
 
G
L
 
I
I
 
A
I
 
F
A
 
A
P
 
P
A
 
L
D
 
S
S
 
S
K
 
V
A
 
N
M
 
L
V
 
V
P
 
M
V
 
P
I
 
V
K
 
A
K
 
R
A
 
A
V
 
W
D
 
Q
A
 
K
G
 
G
I
 
L
T
 
Y
V
 
L
I
 
V
N
 
N
I
 
L
D
|
D
N
 
E
Q
 
K
L
 
I
D
 
D
P
 
M
A
 
D
V
 
N
V
 
L
K
 
K
S
 
K
K
 
A
N
 
G
I
 
G
N
 
N
V
 
V
P
 
E
-
 
G
F
 
F
V
 
V
G
 
T
P
 
T
D
 
D
N
 
N
-
 
V
-
 
A
-
 
V
-
 
G
R
 
A
K
 
K
G
 
G
A
 
A
R
 
D
L
 
F
V
 
I
G
 
I
E
 
N
Y
 
K
L
 
L
A
 
G
K
 
A
Q
 
E
L
 
-
K
 
-
A
 
-
G
 
G
D
 
G
E
 
E
V
 
V
G
 
A
I
 
I
I
 
I
E
 
E
G
 
G
V
 
K
S
 
A
T
 
G
T
 
N
T
 
A
N
 
S
A
 
G
Q
 
E
A
 
A
R
|
R
T
 
R
A
 
N
G
 
G
F
 
A
K
 
T
D
 
E
A
 
A
M
 
F
E
 
K
A
 
K
A
 
A
-
 
N
Q
 
Q
V
 
I
K
 
K
V
 
L
V
 
V
S
 
A
L
 
S
Q
 
Q
S
 
P
G
 
A
D
 
D
W
|
W
E
 
D
I
 
R
N
 
I
K
 
K
G
 
A
N
 
L
Q
 
D
V
 
V
A
 
A
A
 
T
S
 
N
M
 
V
L
 
L
S
 
Q
E
 
R
Y
 
N
P
 
P
N
 
N
I
 
L
K
 
K
A
 
A
L
 
F
L
 
Y
A
 
C
G
 
A
N
|
N
D
 
D
S
 
T
M
 
M
A
 
A
V
 
M
G
 
G
A
 
V
V
 
A
S
 
Q
A
 
A
V
 
V
R
 
A
A
 
N
A
 
A
G
 
G
K
 
K
A
 
I
G
 
G
K
 
K
V
 
V
Q
 
L
V
 
V
V
 
V
G
 
G
Y
 
T
D
|
D
N
 
G
I
 
I
N
 
P
A
 
E
I
 
A
K
 
R
P
 
K
M
 
M
L
 
V
K
 
E
D
 
A
G
 
G
R
 
Q
V
 
M
L
 
T
A
 
A
T
 
T
A
 
V
D
 
A
Q
|
Q
F
 
N
A
 
P
A
 
A
K
 
D
Q
 
I
A
 
G
V
 
A
F
 
T
G
 
G
I
 
L
E
 
K
T
 
L
A
 
M
L
 
V
K
 
D
M
 
A
L
 
A
K
 
K
G
 
T
E
 
G
K
 
K
V
 
V

4wutA Crystal structure of an abc transporter solute binding protein (ipr025997) from agrobacterium vitis (avi_5133, target efi-511220) with bound d-fucose
28% identity, 89% coverage: 36:318/319 of query aligns to 2:277/290 of 4wutA

query
sites
4wutA
K
 
E
V
 
I
A
 
A
L
 
V
V
 
I
M
 
V
K
|
K
S
 
T
L
 
V
A
 
N
N
 
S
E
 
T
F
 
F
F
x
W
L
 
Q
T
 
N
M
 
V
E
 
Q
D
 
K
G
 
G
A
 
A
K
 
D
A
 
A
-
 
A
-
 
I
-
 
G
Y
 
K
Q
 
Q
K
 
K
E
 
A
H
 
H
S
 
T
A
 
I
D
 
T
F
 
F
D
 
-
L
 
-
I
 
-
S
 
-
N
 
Q
G
 
G
I
 
P
K
 
A
D
 
A
E
|
E
T
 
S
D
 
A
T
 
I
A
 
A
N
 
D
Q
 
Q
I
 
V
R
 
N
I
 
M
V
 
V
E
 
E
Q
 
N
M
 
A
I
 
V
V
 
N
S
 
R
K
 
K
V
 
V
D
 
D
A
 
A
L
 
I
I
 
L
I
 
L
A
 
A
P
 
P
A
 
S
D
 
D
S
 
P
K
 
D
A
 
A
M
 
L
V
 
V
P
 
P
V
 
A
I
 
V
K
 
K
K
 
K
A
 
A
V
 
W
D
 
E
A
 
A
G
 
R
I
 
I
T
 
P
V
 
V
I
 
V
N
 
I
I
 
I
D
|
D
N
 
S
Q
 
M
L
 
L
D
 
S
P
 
K
A
 
D
V
 
A
V
 
E
K
 
K
S
 
Y
K
 
Y
N
 
Q
I
 
-
N
 
-
V
 
-
P
 
A
F
 
F
V
 
L
G
 
A
P
 
T
D
 
D
N
 
N
R
 
K
K
 
A
G
 
A
A
 
G
R
 
E
L
 
L
V
 
A
G
 
A
E
 
K
Y
 
A
L
 
M
A
 
I
K
 
Q
Q
 
K
L
 
V
K
 
G
A
 
T
G
 
E
D
 
G
E
 
K
V
 
I
G
 
A
I
 
V
I
 
M
E
 
S
G
 
Y
V
 
V
S
 
A
T
 
G
T
 
A
T
 
G
N
 
S
A
 
E
Q
 
I
A
 
G
R
|
R
T
 
V
A
 
G
G
 
G
F
 
F
K
 
T
D
 
D
A
 
Y
M
 
I
E
x
K
A
 
A
-
 
N
A
x
S
Q
 
K
V
 
L
K
 
Q
V
 
I
V
 
V
S
 
G
L
 
P
Q
 
Y
S
 
Y
G
 
S
D
 
Q
W
 
S
E
 
Q
I
 
M
N
 
A
K
 
T
G
 
A
N
 
L
Q
x
N
V
 
Q
A
 
T
A
 
T
S
x
D
M
 
V
L
 
L
S
 
A
E
 
A
Y
 
N
P
 
A
N
 
D
I
 
L
K
 
K
A
 
G
L
 
I
L
 
F
A
 
G
G
 
A
N
|
N
D
 
E
S
 
P
M
 
T
A
 
A
V
 
I
G
 
G
A
 
M
V
 
G
S
 
R
A
 
A
V
 
I
R
 
K
A
 
Q
A
 
A
G
 
G
K
 
K
A
 
A
G
 
G
K
 
K
V
 
L
Q
 
V
V
 
A
V
 
I
G
 
G
Y
 
F
D
|
D
N
 
G
I
 
N
N
 
Q
A
 
D
I
 
L
K
 
Q
P
 
E
M
 
F
L
 
V
K
 
K
D
 
D
G
 
G
R
 
T
V
 
L
L
 
E
A
 
A
T
 
T
A
 
V
D
 
V
Q
|
Q
F
 
G
A
 
S
A
 
Y
K
 
Q
Q
 
M
A
 
G
V
 
E
F
 
K
G
 
G
I
 
V
E
 
D
T
 
T
A
 
L
L
 
L
K
 
K
M
 
L
L
 
L
K
 
S
G
 
K
E
 
E
K
 
K
V
 
V
D
 
E
S
 
K
G
 
-
T
 
-
N
 
-
G
 
-
V
 
F
I
 
I
E
 
D
T
 
T
P
 
G
V
 
V
E
 
V
L
 
V
V
 
V
T
 
T
K
 
K

2fn8A Thermotoga maritima ribose binding protein ribose bound form (see paper)
28% identity, 89% coverage: 34:318/319 of query aligns to 1:280/292 of 2fn8A

query
sites
2fn8A
K
 
K
P
 
G
K
 
K
V
 
M
A
 
A
L
 
I
V
 
V
M
 
I
K
 
S
S
 
T
L
 
L
A
 
N
N
|
N
E
 
P
F
x
W
F
|
F
L
 
V
T
 
V
M
 
L
E
 
A
D
 
E
G
 
T
A
 
A
K
 
K
A
 
-
Y
 
-
Q
 
Q
K
 
R
E
 
A
H
 
E
S
 
Q
A
 
L
D
 
G
F
 
Y
D
 
E
L
 
-
I
 
-
S
 
A
N
 
T
G
 
I
I
 
F
K
 
D
D
 
S
E
 
Q
T
 
N
D
 
D
T
 
T
A
 
A
N
 
K
Q
 
E
I
 
S
R
 
A
I
 
H
V
 
F
E
 
D
Q
 
A
M
 
I
I
 
I
V
 
A
S
 
A
K
 
G
V
 
Y
D
 
D
A
 
A
L
 
I
I
 
I
I
 
F
A
 
N
P
 
P
A
 
T
D
 
D
S
 
A
K
 
D
A
 
G
M
 
S
V
 
I
P
 
A
V
 
N
I
 
V
K
 
K
K
 
R
A
 
A
V
 
K
D
 
E
A
 
A
G
 
G
I
 
I
T
 
P
V
 
V
I
 
F
N
 
C
I
 
V
D
|
D
N
x
R
Q
 
G
L
 
I
D
 
N
P
 
-
A
 
-
V
 
-
V
 
-
K
 
-
S
 
A
K
 
R
N
 
G
I
 
L
N
 
A
V
 
V
P
 
A
F
 
Q
V
 
I
G
 
Y
P
 
S
D
 
D
N
 
N
R
 
Y
K
 
Y
G
 
G
A
 
G
R
 
V
L
 
L
V
 
M
G
 
G
E
 
E
Y
 
Y
L
 
F
A
 
V
K
 
K
Q
 
F
L
 
L
K
 
K
A
 
E
-
 
K
-
 
Y
-
 
P
-
 
D
G
 
A
D
 
K
E
 
E
V
 
I
G
 
P
I
 
Y
I
 
A
E
 
E
-
 
L
-
 
L
G
 
G
V
 
I
S
 
L
T
 
S
T
 
A
T
 
Q
N
 
P
A
 
T
Q
 
W
A
 
D
R
|
R
T
 
S
A
 
N
G
 
G
F
 
F
K
 
H
D
 
S
A
 
V
M
 
V
-
 
D
E
 
Q
A
 
Y
A
 
P
Q
 
E
V
 
F
K
 
K
V
 
M
V
 
V
S
 
A
L
 
Q
Q
 
Q
S
 
S
G
 
A
D
 
E
W
x
F
E
 
D
I
 
R
N
 
D
K
 
T
G
 
A
N
 
Y
Q
 
K
V
 
V
A
 
T
A
 
E
S
 
Q
M
 
I
L
 
L
S
 
Q
E
 
A
Y
 
H
P
 
P
N
 
E
I
 
I
K
 
K
A
 
A
L
 
I
L
 
W
A
 
C
G
 
G
N
|
N
D
 
D
S
 
A
M
 
M
A
 
A
V
 
L
G
 
G
A
 
A
V
 
M
S
 
K
A
 
A
V
 
C
R
 
E
A
 
A
A
 
A
G
 
G
K
 
R
A
 
T
G
 
-
K
 
D
V
 
I
Q
 
Y
V
 
I
V
 
F
G
 
G
Y
 
F
D
|
D
N
 
G
I
 
A
N
 
E
A
 
D
I
 
V
K
 
I
P
 
N
M
 
A
L
 
I
K
 
K
D
 
E
G
 
G
R
 
K
-
 
Q
V
 
I
L
 
V
A
 
A
T
 
T
A
 
I
D
 
M
Q
|
Q
F
 
F
A
 
P
A
 
K
K
 
L
Q
 
M
A
 
A
V
 
R
F
 
L
G
 
A
I
 
V
E
 
E
T
 
W
A
 
A
L
 
D
K
 
Q
M
 
Y
L
 
L
K
 
R
G
 
G
E
 
E
K
 
R
V
 
-
D
 
-
S
 
-
G
 
S
T
 
F
N
 
P
G
 
E
V
 
I
I
 
V
E
 
P
T
 
V
P
 
T
V
 
V
E
 
E
L
 
L
V
 
V
T
 
T
K
 
R

5ibqA Crystal structure of an abc solute binding protein from rhizobium etli cfn 42 (rhe_pf00037,target efi-511357) in complex with alpha-d-apiose
30% identity, 82% coverage: 37:297/319 of query aligns to 5:256/287 of 5ibqA

query
sites
5ibqA
V
 
I
A
 
A
L
 
I
V
 
I
M
 
T
K
 
P
S
 
A
L
 
H
A
 
D
N
|
N
E
 
P
F
|
F
F
 
F
L
 
K
T
 
A
M
 
E
E
 
A
D
 
V
G
 
G
A
 
A
K
 
E
A
 
A
Y
 
K
Q
 
A
K
 
K
E
 
E
H
 
L
S
 
G
A
 
Y
D
 
E
F
 
T
D
 
L
L
 
V
I
 
M
S
 
T
N
 
H
G
 
-
I
 
-
K
 
-
D
 
-
E
 
D
T
 
D
D
 
D
T
 
A
A
 
N
N
 
K
Q
 
Q
I
 
S
R
 
E
I
 
M
V
 
I
E
 
D
Q
 
T
M
 
A
I
 
I
V
 
G
S
 
R
K
 
G
V
 
A
D
 
K
A
 
A
L
 
I
I
 
I
I
 
L
A
 
D
P
 
N
A
 
A
D
 
G
S
 
A
K
 
D
A
 
A
M
 
S
V
 
V
P
 
A
V
 
A
I
 
V
K
 
K
K
 
K
A
 
A
V
 
K
D
 
D
A
 
A
G
 
G
I
 
I
T
 
P
V
 
S
I
 
F
N
 
L
I
 
I
D
|
D
N
x
R
Q
 
E
L
 
I
D
 
N
P
 
-
A
 
-
V
 
-
V
 
-
K
 
-
S
 
A
K
 
T
N
 
G
I
 
V
N
 
A
V
 
V
P
 
A
F
 
Q
V
 
I
G
 
V
P
 
S
D
 
N
N
 
N
R
 
Y
K
 
Q
G
 
G
A
 
A
R
 
Q
L
 
L
V
 
G
G
 
A
E
 
Q
Y
 
E
L
 
F
A
 
V
K
 
K
Q
 
L
L
 
M
-
 
G
K
 
E
A
 
K
G
 
G
D
 
N
E
 
Y
V
 
V
G
 
E
I
 
L
I
 
V
E
 
-
G
 
G
V
 
K
S
 
E
T
 
S
T
x
D
T
 
T
N
|
N
A
 
A
Q
 
G
A
 
I
R
|
R
T
 
S
A
 
Q
G
 
G
F
 
Y
K
 
H
D
|
D
A
 
V
M
 
I
E
x
D
-
x
D
A
 
Y
A
 
P
Q
 
E
V
 
M
K
 
K
V
 
S
V
 
V
S
 
A
L
 
K
Q
 
Q
S
 
S
G
 
A
D
 
N
W
|
W
E
 
S
I
 
Q
N
 
T
K
 
E
G
 
A
N
 
Y
Q
 
S
V
 
K
A
 
M
A
 
E
S
 
T
M
 
I
L
 
L
S
 
Q
E
 
A
Y
 
N
P
 
P
N
 
D
I
 
I
K
 
K
A
 
G
L
 
V
L
 
I
A
 
S
G
 
G
N
|
N
D
 
D
S
 
T
M
 
M
A
 
A
V
 
M
G
 
G
A
 
A
V
 
I
S
 
A
A
 
A
V
 
L
R
 
Q
A
 
A
A
 
A
G
 
G
K
 
R
A
 
K
G
 
-
K
 
D
V
 
V
Q
 
I
V
 
V
V
 
V
G
 
G
Y
 
F
D
|
D
N
 
G
I
 
S
N
 
N
A
 
D
I
 
V
K
 
R
P
 
D
M
 
S
L
 
I
K
 
K
D
 
S
G
 
G
R
 
G
V
 
I
L
 
K
A
 
A
T
 
T
A
 
V
D
 
L
Q
 
Q
F
 
P
A
 
A
A
 
Y
K
 
A
Q
 
Q
A
 
A
V
 
Q
F
 
L
G
 
A
I
 
V
E
 
E
T
 
Q
A
 
A
L
 
D
K
 
A
M
 
Y
L
 
I
K
 
K

4ry0A Crystal structure of ribose transporter solute binding protein rhe_pf00037 from rhizobium etli cfn 42, target efi-511357, in complex with d-ribose
30% identity, 82% coverage: 37:297/319 of query aligns to 5:256/287 of 4ry0A

query
sites
4ry0A
V
 
I
A
 
A
L
 
I
V
 
I
M
 
T
K
 
P
S
 
A
L
 
H
A
 
D
N
|
N
E
 
P
F
 
F
F
|
F
L
 
K
T
 
A
M
 
E
E
 
A
D
 
V
G
 
G
A
 
A
K
 
E
A
 
A
Y
 
K
Q
 
A
K
 
K
E
 
E
H
 
L
S
 
G
A
 
Y
D
 
E
F
 
T
D
 
L
L
 
V
I
 
M
S
 
T
N
 
H
G
 
-
I
 
-
K
 
-
D
 
-
E
 
D
T
 
D
D
 
D
T
 
A
A
 
N
N
 
K
Q
 
Q
I
 
S
R
 
E
I
 
M
V
 
I
E
 
D
Q
 
T
M
 
A
I
 
I
V
 
G
S
 
R
K
 
G
V
 
A
D
 
K
A
 
A
L
 
I
I
 
I
I
 
L
A
 
D
P
 
N
A
 
A
D
 
G
S
 
A
K
 
D
A
 
A
M
 
S
V
 
V
P
 
A
V
 
A
I
 
V
K
 
K
K
 
K
A
 
A
V
 
K
D
 
D
A
 
A
G
 
G
I
 
I
T
 
P
V
 
S
I
 
F
N
 
L
I
 
I
D
|
D
N
x
R
Q
 
E
L
 
I
D
 
N
P
 
-
A
 
-
V
 
-
V
 
-
K
 
-
S
 
A
K
 
T
N
 
G
I
 
V
N
 
A
V
 
V
P
 
A
F
 
Q
V
 
I
G
 
V
P
 
S
D
 
N
N
 
N
R
 
Y
K
 
Q
G
 
G
A
 
A
R
 
Q
L
 
L
V
 
G
G
 
A
E
 
Q
Y
 
E
L
 
F
A
 
V
K
 
K
Q
 
L
L
 
M
-
 
G
K
 
E
A
 
K
G
 
G
D
 
N
E
 
Y
V
 
V
G
 
E
I
 
L
I
 
V
E
 
-
G
 
G
V
 
K
S
 
E
T
 
S
T
x
D
T
 
T
N
 
N
A
 
A
Q
 
G
A
 
I
R
|
R
T
 
S
A
 
Q
G
 
G
F
 
Y
K
 
H
D
|
D
A
 
V
M
 
I
E
x
D
-
x
D
A
 
Y
A
 
P
Q
 
E
V
 
M
K
 
K
V
 
S
V
 
V
S
 
A
L
 
K
Q
 
Q
S
 
S
G
 
A
D
 
N
W
|
W
E
 
S
I
 
Q
N
 
T
K
 
E
G
 
A
N
 
Y
Q
 
S
V
 
K
A
 
M
A
 
E
S
 
T
M
 
I
L
 
L
S
 
Q
E
 
A
Y
 
N
P
 
P
N
 
D
I
 
I
K
 
K
A
 
G
L
 
V
L
 
I
A
 
S
G
 
G
N
|
N
D
 
D
S
 
T
M
 
M
A
 
A
V
 
M
G
 
G
A
 
A
V
 
I
S
 
A
A
 
A
V
 
L
R
 
Q
A
 
A
A
 
A
G
 
G
K
 
R
A
 
K
G
 
-
K
 
D
V
 
V
Q
 
I
V
 
V
V
 
V
G
 
G
Y
 
F
D
|
D
N
 
G
I
 
S
N
 
N
A
 
D
I
 
V
K
 
R
P
 
D
M
 
S
L
 
I
K
 
K
D
 
S
G
 
G
R
 
G
V
 
I
L
 
K
A
 
A
T
 
T
A
 
V
D
 
L
Q
|
Q
F
 
P
A
 
A
A
 
Y
K
 
A
Q
 
Q
A
 
A
V
 
Q
F
 
L
G
 
A
I
 
V
E
 
E
T
 
Q
A
 
A
L
 
D
K
 
A
M
 
Y
L
 
I
K
 
K

2h3hA Crystal structure of the liganded form of thermotoga maritima glucose binding protein (see paper)
26% identity, 88% coverage: 37:317/319 of query aligns to 4:285/313 of 2h3hA

query
sites
2h3hA
V
 
I
A
 
G
L
 
V
V
 
I
M
 
G
K
|
K
S
 
S
L
 
V
A
 
-
N
 
H
E
 
P
F
 
Y
F
 
W
L
 
S
T
 
Q
M
 
V
E
 
E
D
 
Q
G
 
G
A
 
V
K
 
K
A
 
A
Y
 
A
Q
 
G
K
 
K
E
 
A
H
 
L
S
 
G
A
 
V
D
 
D
F
 
T
D
 
K
L
 
F
I
 
F
S
 
-
N
 
-
G
 
-
I
 
V
K
 
P
D
 
Q
E
 
K
T
 
E
D
 
D
T
 
I
A
 
N
N
 
A
Q
 
Q
I
 
L
R
 
Q
I
 
M
V
 
L
E
 
E
Q
 
S
M
 
F
I
 
I
V
 
A
S
 
E
K
 
G
V
 
V
D
 
N
A
 
G
L
 
I
I
 
A
I
 
I
A
 
A
P
 
P
A
 
S
D
 
D
S
 
P
K
 
T
A
 
A
M
 
V
V
 
I
P
 
P
V
 
T
I
 
I
K
 
K
K
 
K
A
 
A
V
 
L
D
 
E
A
 
M
G
 
G
I
 
I
T
 
P
V
 
V
I
 
V
N
 
T
I
 
L
D
|
D
N
 
T
Q
 
D
L
 
-
D
 
-
P
 
-
A
 
-
V
 
-
V
 
-
K
 
S
S
 
P
K
 
D
N
 
S
I
 
G
N
 
R
V
 
Y
P
 
V
F
 
Y
V
 
I
G
 
G
P
 
T
D
 
D
N
 
N
R
 
Y
K
 
Q
G
 
A
A
 
G
R
 
Y
L
 
T
V
 
A
G
 
G
E
 
L
Y
 
I
L
 
M
A
 
K
K
 
E
Q
 
L
L
 
L
K
 
G
A
 
G
G
 
K
D
 
G
E
 
K
V
 
V
G
 
V
I
 
I
I
 
G
E
 
T
G
 
G
V
 
S
S
 
L
T
 
T
T
 
A
T
 
M
N
|
N
A
 
S
Q
 
L
A
 
Q
R
|
R
T
 
I
A
 
Q
G
 
G
F
 
F
K
 
K
D
 
D
A
 
A
M
 
I
E
 
K
A
 
D
A
 
S
Q
 
E
V
 
I
K
 
E
V
 
I
V
 
V
S
 
D
L
 
I
Q
 
L
S
 
N
G
 
D
D
 
E
W
x
E
E
 
D
I
 
G
N
 
A
K
 
R
G
 
A
N
 
V
Q
 
S
V
 
L
A
 
A
A
 
E
S
 
A
M
 
A
L
 
L
S
 
N
E
 
A
Y
 
H
P
 
P
N
 
D
I
 
L
K
 
D
A
 
A
L
 
F
L
 
F
A
 
G
G
 
V
N
x
Y
D
x
A
S
 
Y
M
 
N
A
 
G
V
 
P
G
 
A
A
 
Q
V
 
A
S
 
L
A
 
V
V
 
V
R
 
K
A
 
N
A
 
A
G
 
G
K
 
K
A
 
V
G
 
G
K
 
K
V
 
V
Q
 
K
V
 
I
V
 
V
G
 
C
Y
 
F
D
|
D
N
 
T
I
 
T
N
 
P
A
 
D
I
 
I
K
 
L
P
 
Q
M
 
Y
L
 
V
K
 
K
D
 
E
G
 
G
R
 
V
V
 
I
L
 
Q
A
 
A
T
 
T
A
 
M
D
 
G
Q
|
Q
-
 
R
-
 
P
-
 
Y
-
 
M
-
 
M
-
 
G
F
 
Y
A
 
L
A
 
S
K
 
V
Q
 
T
A
 
V
V
 
L
F
 
Y
-
 
L
-
 
M
-
 
N
-
 
K
-
 
I
G
 
G
I
 
V
E
 
Q
T
 
N
A
 
T
L
 
L
K
 
M
M
 
M
L
 
L
K
 
P
G
 
K
E
 
V
K
 
K
V
 
V
D
 
D
S
 
G
G
 
K
T
 
V
N
 
D
G
 
Y
V
 
V
I
 
I
E
 
D
T
 
T
P
 
G
V
 
V
E
 
D
L
 
V
V
 
V
T
 
T

7e7mC Crystal structure analysis of the streptococcus agalactiae ribose binding protein rbsb
29% identity, 91% coverage: 30:318/319 of query aligns to 4:276/284 of 7e7mC

query
sites
7e7mC
Q
 
K
T
 
S
A
 
A
E
 
K
K
 
D
P
 
L
K
 
K
V
 
L
A
 
G
L
 
V
V
 
S
M
 
I
K
 
S
S
 
T
L
 
T
A
 
N
N
|
N
E
 
P
F
x
Y
F
|
F
L
 
V
T
 
A
M
 
M
E
 
K
D
 
D
G
 
G
A
 
I
K
 
D
A
 
K
Y
 
Y
Q
 
A
K
 
S
E
 
N
H
 
K
S
 
K
A
 
-
D
 
-
F
 
-
D
 
-
L
 
-
I
 
I
S
 
S
N
 
I
G
 
K
I
 
V
K
 
A
D
 
D
-
 
A
E
 
Q
T
 
D
D
 
D
T
 
A
A
 
A
N
 
R
Q
 
Q
I
 
A
R
 
D
I
 
D
V
 
V
E
 
Q
Q
 
N
M
 
F
I
 
I
V
 
S
S
 
Q
K
 
N
V
 
V
D
 
D
A
 
A
L
 
I
I
 
L
I
 
I
A
 
N
P
 
P
A
 
V
D
 
D
S
 
S
K
 
K
A
 
A
M
 
I
V
 
V
P
 
T
V
 
A
I
 
I
K
 
K
K
 
S
A
 
A
V
 
N
D
 
N
A
 
A
G
 
N
I
 
I
T
 
P
V
 
V
I
 
I
N
 
L
I
 
M
D
|
D
N
x
R
Q
 
G
L
 
S
D
 
E
P
 
G
A
 
G
V
 
K
V
 
V
K
 
-
S
 
-
K
 
-
N
 
-
I
 
-
N
 
-
V
 
L
P
 
T
F
 
T
V
 
V
G
 
A
P
 
S
D
 
D
N
 
N
R
 
V
K
 
A
G
 
A
A
 
G
R
 
K
L
 
M
V
 
A
G
 
A
E
 
D
Y
 
Y
L
 
A
A
 
V
K
 
K
Q
 
K
L
 
L
K
 
G
A
 
K
G
 
K
D
 
A
E
 
K
V
 
A
G
 
F
I
 
E
I
 
L
E
 
S
G
 
G
V
 
V
S
 
P
T
 
G
T
 
A
T
 
S
N
 
A
A
 
T
Q
 
V
A
 
D
R
|
R
T
 
G
A
 
K
G
 
G
F
 
F
K
 
H
D
 
-
A
 
S
M
 
V
E
 
A
A
 
K
A
 
S
Q
 
K
V
 
L
K
 
D
V
 
M
V
 
L
S
 
S
L
 
S
Q
 
Q
S
 
S
G
 
A
D
 
N
W
x
F
E
 
D
I
 
R
N
 
A
K
 
K
G
 
A
N
 
L
Q
 
N
V
 
T
A
 
T
A
 
Q
S
 
N
M
 
M
L
 
I
S
 
Q
E
 
G
Y
 
H
P
 
K
N
 
D
I
 
V
K
 
Q
A
 
I
L
 
I
L
 
F
A
 
A
G
 
Q
N
|
N
D
 
D
S
 
E
M
 
M
A
 
A
V
 
L
G
 
G
A
 
A
V
 
A
S
 
Q
A
 
A
V
 
V
R
 
K
A
 
S
A
 
A
G
 
G
K
 
-
A
 
L
G
 
Q
K
 
N
V
 
V
Q
 
L
V
 
I
V
 
V
G
 
G
Y
 
I
D
|
D
N
 
G
I
 
Q
N
 
P
A
 
D
I
 
A
K
 
H
P
 
D
M
 
A
L
 
I
K
 
K
D
 
K
G
 
G
R
 
D
V
 
I
L
 
S
A
 
A
T
 
T
A
 
I
D
 
A
Q
|
Q
F
 
Q
A
 
P
A
 
A
K
 
K
Q
 
M
A
 
G
V
 
E
F
 
I
G
 
A
I
 
I
E
 
Q
T
 
A
A
 
A
L
 
I
K
 
D
M
 
Y
L
 
Y
K
 
K
G
 
G
E
 
K
K
 
K
V
 
V
D
 
E
S
 
K
G
 
E
T
 
T
N
 
-
G
 
-
V
 
-
I
 
-
E
 
I
T
 
S
P
 
P
V
 
I
E
 
Y
L
 
L
V
 
V
T
 
T
K
 
K

3c6qC Apo and ligand-bound form of a thermophilic glucose/xylose binding protein
26% identity, 88% coverage: 37:317/319 of query aligns to 4:285/305 of 3c6qC

query
sites
3c6qC
V
 
I
A
 
G
L
 
V
V
 
I
M
 
G
K
|
K
S
 
S
L
 
V
A
 
-
N
 
H
E
 
P
F
 
Y
F
x
W
L
 
S
T
 
Q
M
 
V
E
 
E
D
 
Q
G
 
G
A
 
V
K
 
K
A
 
A
Y
 
A
Q
 
G
K
 
K
E
 
A
H
 
L
S
 
G
A
 
V
D
 
D
F
 
T
D
 
K
L
 
F
I
 
F
S
 
-
N
 
-
G
 
-
I
 
V
K
 
P
D
 
Q
E
 
K
T
 
C
D
 
D
T
 
I
A
 
N
N
 
A
Q
 
Q
I
 
L
R
 
Q
I
 
M
V
 
L
E
 
E
Q
 
S
M
 
F
I
 
I
V
 
A
S
 
E
K
 
G
V
 
V
D
 
N
A
 
G
L
 
I
I
 
A
I
 
I
A
 
A
P
 
P
A
 
S
D
 
D
S
 
P
K
 
T
A
 
A
M
 
V
V
 
I
P
 
P
V
 
T
I
 
I
K
 
K
K
 
K
A
 
A
V
 
L
D
 
E
A
 
M
G
 
G
I
 
I
T
 
P
V
 
V
I
 
V
N
 
T
I
 
L
D
|
D
N
 
T
Q
 
D
L
 
-
D
 
-
P
 
-
A
 
-
V
 
-
V
 
-
K
 
S
S
 
P
K
 
D
N
 
S
I
 
G
N
 
R
V
 
Y
P
 
V
F
 
Y
V
 
I
G
 
G
P
 
T
D
 
D
N
 
N
R
 
Y
K
 
Q
G
 
A
A
 
G
R
 
Y
L
 
T
V
 
A
G
 
G
E
 
L
Y
 
I
L
 
M
A
 
K
K
 
E
Q
 
L
L
 
L
K
 
G
A
 
G
G
 
K
D
 
G
E
 
K
V
 
V
G
 
V
I
 
I
I
 
G
E
 
T
G
 
G
V
 
S
S
 
L
T
 
T
T
 
A
T
 
M
N
|
N
A
 
S
Q
 
L
A
 
Q
R
|
R
T
 
I
A
 
Q
G
 
G
F
 
F
K
 
K
D
 
D
A
 
A
M
 
I
E
 
K
A
 
D
A
 
S
Q
 
E
V
 
I
K
 
E
V
 
I
V
 
V
S
 
D
L
 
I
Q
 
L
S
 
N
G
 
D
D
 
C
W
x
E
E
 
D
I
 
G
N
 
A
K
 
R
G
 
A
N
 
V
Q
 
S
V
 
L
A
 
A
A
 
E
S
 
A
M
 
A
L
 
L
S
 
N
E
 
A
Y
 
H
P
 
P
N
 
D
I
 
L
K
 
D
A
 
A
L
 
F
L
 
F
A
 
G
G
 
V
N
x
Y
D
x
A
S
 
Y
M
 
N
A
 
G
V
 
P
G
 
A
A
 
Q
V
 
A
S
 
L
A
 
V
V
 
V
R
 
K
A
 
N
A
 
A
G
 
G
K
 
K
A
 
V
G
 
G
K
 
K
V
 
V
Q
 
K
V
 
I
V
 
V
G
 
C
Y
 
F
D
|
D
N
 
T
I
 
T
N
 
P
A
 
D
I
 
I
K
 
L
P
 
Q
M
 
Y
L
 
V
K
 
K
D
 
E
G
 
G
R
 
V
V
 
I
L
 
Q
A
 
A
T
 
T
A
 
M
D
 
G
Q
|
Q
-
 
R
-
 
P
-
 
Y
-
 
M
-
 
M
-
 
G
F
 
Y
A
 
L
A
 
S
K
 
V
Q
 
T
A
 
V
V
 
L
F
 
Y
-
 
L
-
 
M
-
 
N
-
 
K
-
 
I
G
 
G
I
 
V
E
 
Q
T
 
N
A
 
T
L
 
L
K
 
M
M
 
M
L
 
L
K
 
P
G
 
K
E
 
V
K
 
K
V
 
V
D
 
D
S
 
G
G
 
K
T
 
V
N
 
D
G
 
Y
V
 
V
I
 
I
E
 
D
T
 
T
P
 
G
V
 
V
E
 
D
L
 
V
V
 
V
T
 
T

6gt9A Crystal structure of ganp, a glucose-galactose binding protein from geobacillus stearothermophilus, in complex with galactose
26% identity, 87% coverage: 31:306/319 of query aligns to 3:270/283 of 6gt9A

query
sites
6gt9A
T
 
T
A
 
K
E
 
E
K
 
A
P
 
Y
K
 
H
V
 
F
A
 
V
L
 
L
V
 
V
M
 
P
K
x
E
S
 
E
L
 
L
A
 
D
N
|
N
E
 
D
F
x
Y
F
x
W
L
 
R
T
 
L
M
 
V
E
 
E
D
 
K
G
 
G
A
 
A
K
 
K
A
 
A
Y
 
A
Q
 
A
K
 
K
E
 
E
H
 
L
S
 
G
A
 
V
D
 
D
F
 
L
D
 
E
L
 
Y
I
 
I
S
 
G
N
 
-
G
 
-
I
 
-
K
 
P
D
 
R
E
 
Q
T
 
A
D
 
N
T
 
I
A
 
D
N
 
E
Q
 
H
I
 
L
R
 
R
I
 
I
V
 
L
E
 
K
Q
 
K
M
 
A
I
 
A
V
 
A
S
 
A
K
 
K
V
 
V
D
 
D
A
 
G
L
 
I
I
 
I
I
 
T
A
 
Q
P
 
G
A
 
L
D
 
T
S
 
E
K
 
A
A
 
E
M
 
F
V
 
V
P
 
P
V
 
V
I
 
I
K
 
N
K
 
E
A
 
I
V
 
T
D
 
D
A
 
K
G
 
N
I
 
I
T
 
P
V
 
V
I
 
V
N
 
T
I
 
I
D
|
D
N
 
T
Q
 
D
L
 
-
D
 
-
P
 
-
A
 
-
V
 
-
V
 
-
K
 
A
S
 
P
K
 
T
N
 
S
I
 
R
N
 
R
V
 
V
P
 
A
F
 
Y
V
 
V
G
 
G
P
 
T
D
 
D
N
 
N
R
 
Y
K
 
Y
G
 
A
A
 
G
R
 
F
L
 
L
V
 
A
G
 
G
E
 
R
Y
 
A
L
 
L
A
 
A
K
 
E
Q
 
D
L
 
T
K
 
K
A
 
G
G
 
K
D
 
A
E
 
T
V
 
V
G
 
A
I
 
I
I
 
I
E
 
T
G
 
G
V
 
S
S
 
L
T
 
T
T
 
A
T
 
A
N
x
H
A
 
Q
Q
 
Q
A
 
L
R
|
R
T
 
V
A
 
R
G
 
G
F
 
F
K
 
E
D
 
D
A
 
A
M
 
V
E
 
R
A
 
Q
A
 
E
Q
 
K
-
 
G
V
 
I
K
 
R
V
 
I
V
 
V
S
 
A
L
 
I
Q
 
E
S
 
E
G
 
S
D
 
H
W
x
I
E
 
T
I
 
R
N
 
V
K
 
Q
G
 
A
N
 
A
Q
 
E
V
 
K
A
 
A
A
 
Y
S
 
T
M
 
I
L
 
L
S
 
K
E
 
K
Y
 
H
P
 
P
N
 
D
I
 
V
K
 
N
A
 
A
L
 
F
L
 
Y
A
 
G
G
 
T
N
x
S
D
x
A
S
 
L
M
 
D
A
 
A
V
 
I
G
 
G
A
 
V
V
 
A
S
 
K
A
 
V
V
 
V
R
 
E
A
 
Q
A
 
F
G
 
H
K
 
R
A
 
E
G
 
Q
K
 
K
V
 
T
Q
 
Y
V
 
I
V
 
I
G
 
G
Y
 
F
D
|
D
N
 
T
I
 
L
N
 
P
A
 
E
I
 
T
K
 
I
P
 
R
M
 
Y
L
 
L
K
 
Q
D
 
K
G
 
G
R
 
T
V
 
I
L
 
A
A
 
A
T
 
T
A
 
V
D
 
V
Q
|
Q
F
 
E
A
 
P
A
 
Y
K
 
E
Q
 
M
A
 
G
V
 
Y
F
 
K
G
 
A
I
 
V
E
 
K
T
 
M
A
 
M
L
 
A
K
 
E
M
 
I
L
 
V
K
 
A
G
 
G
E
 
K
K
 
D
V
 
V
D
 
P
S
 
V
G
 
V
T
 
T
N
 
N

6guqA Crystal structure of ganp, a glucose-galactose binding protein from geobacillus stearothermophilus, in complex with glucose
26% identity, 84% coverage: 39:306/319 of query aligns to 6:265/278 of 6guqA

query
sites
6guqA
L
 
L
V
 
V
M
 
P
K
x
E
S
 
E
L
 
L
A
 
D
N
|
N
E
 
D
F
x
Y
F
 
W
L
 
R
T
 
L
M
 
V
E
 
E
D
 
K
G
 
G
A
 
A
K
 
K
A
 
A
Y
 
A
Q
 
A
K
 
K
E
 
E
H
 
L
S
 
G
A
 
V
D
 
D
F
 
L
D
 
E
L
 
Y
I
 
I
S
 
G
N
 
-
G
 
-
I
 
-
K
 
P
D
 
R
E
 
Q
T
 
A
D
 
N
T
 
I
A
 
D
N
 
E
Q
 
H
I
 
L
R
 
R
I
 
I
V
 
L
E
 
K
Q
 
K
M
 
A
I
 
A
V
 
A
S
 
A
K
 
K
V
 
V
D
 
D
A
 
G
L
 
I
I
 
I
I
 
T
A
 
Q
P
 
G
A
 
L
D
 
T
S
 
E
K
 
A
A
 
E
M
 
F
V
 
V
P
 
P
V
 
V
I
 
I
K
 
N
K
 
E
A
 
I
V
 
T
D
 
D
A
 
K
G
 
N
I
 
I
T
 
P
V
 
V
I
 
V
N
 
T
I
 
I
D
|
D
N
 
T
Q
 
D
L
 
-
D
 
-
P
 
-
A
 
-
V
 
-
V
 
-
K
 
A
S
 
P
K
 
T
N
 
S
I
 
R
N
 
R
V
 
V
P
 
A
F
 
Y
V
 
V
G
 
G
P
 
T
D
 
D
N
 
N
R
 
Y
K
 
Y
G
 
A
A
 
G
R
 
F
L
 
L
V
 
A
G
 
G
E
 
R
Y
 
A
L
 
L
A
 
A
K
 
E
Q
 
D
L
 
T
K
 
K
A
 
G
G
 
K
D
 
A
E
 
T
V
 
V
G
 
A
I
 
I
I
 
I
E
 
T
G
 
G
V
 
S
S
 
L
T
 
T
T
 
A
T
 
A
N
x
H
A
 
Q
Q
 
Q
A
 
L
R
|
R
T
 
V
A
 
R
G
 
G
F
 
F
K
 
E
D
 
D
A
 
A
M
 
V
E
 
R
A
 
Q
A
 
E
Q
 
K
-
 
G
V
 
I
K
 
R
V
 
I
V
 
V
S
 
A
L
 
I
Q
 
E
S
 
E
G
 
S
D
 
H
W
x
I
E
 
T
I
 
R
N
 
V
K
 
Q
G
 
A
N
 
A
Q
 
E
V
 
K
A
 
A
A
 
Y
S
 
T
M
 
I
L
 
L
S
 
K
E
 
K
Y
 
H
P
 
P
N
 
D
I
 
V
K
 
N
A
 
A
L
 
F
L
 
Y
A
 
G
G
 
T
N
x
S
D
x
A
S
 
L
M
 
D
A
 
A
V
 
I
G
 
G
A
 
V
V
 
A
S
 
K
A
 
V
V
 
V
R
 
E
A
 
Q
A
 
F
G
 
H
K
 
R
A
 
E
G
 
Q
K
 
K
V
 
T
Q
 
Y
V
 
I
V
 
I
G
 
G
Y
 
F
D
|
D
N
 
T
I
 
L
N
 
P
A
 
E
I
 
T
K
 
I
P
 
R
M
 
Y
L
 
L
K
 
Q
D
 
K
G
 
G
R
 
T
V
 
I
L
 
A
A
 
A
T
 
T
A
 
V
D
 
V
Q
|
Q
F
 
E
A
 
P
A
 
Y
K
 
E
Q
 
M
A
 
G
V
 
Y
F
 
K
G
 
A
I
 
V
E
 
K
T
 
M
A
 
M
L
 
A
K
 
E
M
 
I
L
 
V
K
 
A
G
 
G
E
 
K
K
 
D
V
 
V
D
 
P
S
 
V
G
 
V
T
 
T
N
 
N

2vk2A Crystal structure of a galactofuranose binding protein (see paper)
33% identity, 62% coverage: 82:278/319 of query aligns to 45:245/296 of 2vk2A

query
sites
2vk2A
N
 
N
Q
 
Q
I
 
I
R
 
K
I
 
A
V
 
V
E
 
R
Q
 
S
M
 
F
I
 
V
V
 
A
S
 
Q
K
 
G
V
 
V
D
 
D
A
 
A
L
 
I
I
 
F
I
 
I
A
 
A
P
 
P
A
 
V
D
 
V
S
 
A
K
 
T
A
 
G
M
 
W
V
 
E
P
 
P
V
 
V
I
 
L
K
 
K
K
 
E
A
 
A
V
 
K
D
 
D
A
 
A
G
 
E
I
 
I
T
 
P
V
 
V
I
 
F
N
 
L
I
 
L
D
|
D
N
x
R
Q
 
S
L
 
I
D
 
D
P
 
-
A
 
-
V
 
-
V
 
V
K
 
K
S
 
D
K
 
K
N
 
S
I
 
L
N
 
Y
V
 
M
P
 
T
F
 
T
V
 
V
G
 
T
P
 
A
D
 
D
N
 
N
R
 
I
K
 
L
G
 
E
A
 
G
R
 
K
L
 
L
V
 
I
G
 
G
E
 
D
Y
 
W
L
 
L
A
 
V
K
 
K
Q
 
E
L
 
V
K
 
N
A
 
-
G
 
G
D
 
K
E
 
P
V
 
C
G
 
N
I
 
V
I
 
V
E
 
E
-
 
L
-
 
Q
G
 
G
V
 
T
S
 
V
T
 
G
T
 
A
T
 
S
N
 
V
A
 
A
Q
 
I
A
 
D
R
|
R
T
 
K
A
 
K
G
 
G
F
 
F
K
 
A
D
 
E
A
 
A
M
 
I
E
 
K
-
 
N
A
 
A
A
 
P
Q
 
N
V
 
I
K
 
K
V
 
I
V
 
I
S
 
R
L
 
S
Q
 
Q
S
 
S
G
 
G
D
 
D
W
x
F
E
 
T
I
 
R
N
 
S
K
 
K
G
 
G
N
 
K
Q
 
E
V
 
V
A
 
M
A
 
E
S
 
S
M
 
F
L
 
I
-
 
K
-
 
A
-
 
E
S
 
N
E
 
N
Y
 
G
P
 
K
N
 
N
I
 
I
K
 
C
A
 
M
L
 
V
L
 
Y
A
 
A
G
 
H
N
|
N
D
 
D
S
 
D
M
 
M
A
 
V
V
 
I
G
 
G
A
 
A
V
 
I
S
 
Q
A
 
A
V
 
I
R
 
K
A
 
E
A
 
A
G
 
G
-
 
L
K
 
K
A
 
P
G
 
G
K
 
K
V
 
D
Q
 
I
V
 
L
V
 
T
G
 
G
-
 
S
Y
 
I
D
|
D
N
 
G
I
 
V
N
 
P
A
 
D
I
 
I
K
 
Y
P
 
K
M
 
A
L
 
M
K
 
M
D
 
D
G
 
G
R
 
E
V
 
A
L
 
N
A
 
A
T
 
S
A
 
V
D
 
E

Sites not aligning to the query:

P39325 Galactofuranose-binding protein YtfQ from Escherichia coli (strain K12) (see 2 papers)
33% identity, 62% coverage: 82:278/319 of query aligns to 67:267/318 of P39325

query
sites
P39325
N
 
N
Q
 
Q
I
 
I
R
 
K
I
 
A
V
 
V
E
 
R
Q
 
S
M
 
F
I
 
V
V
 
A
S
 
Q
K
 
G
V
 
V
D
 
D
A
 
A
L
 
I
I
 
F
I
 
I
A
 
A
P
 
P
A
 
V
D
 
V
S
 
A
K
 
T
A
 
G
M
 
W
V
 
E
P
 
P
V
 
V
I
 
L
K
 
K
K
 
E
A
 
A
V
 
K
D
 
D
A
 
A
G
 
E
I
 
I
T
 
P
V
 
V
I
 
F
N
 
L
I
 
L
D
|
D
N
x
R
Q
 
S
L
 
I
D
 
D
P
 
-
A
 
-
V
 
-
V
 
V
K
 
K
S
 
D
K
 
K
N
 
S
I
 
L
N
 
Y
V
 
M
P
 
T
F
 
T
V
 
V
G
 
T
P
 
A
D
 
D
N
 
N
R
 
I
K
 
L
G
 
E
A
 
G
R
 
K
L
 
L
V
 
I
G
 
G
E
 
D
Y
 
W
L
 
L
A
 
V
K
 
K
Q
 
E
L
 
V
K
 
N
A
 
-
G
 
G
D
 
K
E
 
P
V
x
C
G
 
N
I
 
V
I
 
V
E
 
E
-
 
L
-
 
Q
G
 
G
V
 
T
S
 
V
T
 
G
T
 
A
T
 
S
N
 
V
A
 
A
Q
 
I
A
 
D
R
|
R
T
 
K
A
 
K
G
 
G
F
 
F
K
 
A
D
 
E
A
 
A
M
 
I
E
 
K
-
 
N
A
 
A
A
 
P
Q
 
N
V
 
I
K
 
K
V
 
I
V
 
I
S
 
R
L
 
S
Q
 
Q
S
 
S
G
 
G
D
 
D
W
 
F
E
 
T
I
 
R
N
 
S
K
 
K
G
 
G
N
 
K
Q
 
E
V
 
V
A
 
M
A
 
E
S
 
S
M
 
F
L
 
I
-
 
K
-
 
A
-
 
E
S
 
N
E
 
N
Y
 
G
P
 
K
N
 
N
I
 
I
K
x
C
A
 
M
L
 
V
L
 
Y
A
 
A
G
 
H
N
|
N
D
 
D
S
 
D
M
 
M
A
 
V
V
 
I
G
 
G
A
 
A
V
 
I
S
 
Q
A
 
A
V
 
I
R
 
K
A
 
E
A
 
A
G
 
G
-
 
L
K
 
K
A
 
P
G
 
G
K
 
K
V
 
D
Q
 
I
V
 
L
V
 
T
G
 
G
-
 
S
Y
 
I
D
|
D
N
 
G
I
 
V
N
 
P
A
 
D
I
 
I
K
 
Y
P
 
K
M
 
A
L
 
M
K
 
M
D
 
D
G
 
G
R
 
E
V
 
A
L
 
N
A
 
A
T
 
S
A
 
V
D
 
E

Sites not aligning to the query:

4irxA Crystal structure of caulobacter myo-inositol binding protein bound to myo-inositol (see paper)
28% identity, 84% coverage: 36:304/319 of query aligns to 10:269/296 of 4irxA

query
sites
4irxA
K
 
E
V
 
V
A
 
V
L
 
V
V
 
S
M
 
F
K
 
N
S
 
D
L
 
L
A
 
S
N
x
Q
E
 
P
F
|
F
F
 
F
L
 
V
T
 
A
M
 
M
E
 
-
D
 
-
G
 
-
A
 
-
K
 
R
A
 
R
Y
 
E
Q
 
L
K
 
E
E
 
D
H
 
E
S
 
A
A
 
A
D
 
K
F
 
L
D
 
G
L
 
V
I
 
K
S
 
V
N
 
Q
G
 
V
I
 
L
K
 
D
D
 
A
E
 
Q
T
 
N
D
 
N
T
 
S
A
 
S
N
 
K
Q
 
Q
I
 
I
R
 
S
I
 
D
V
 
L
E
 
Q
Q
 
A
M
 
A
I
 
A
V
 
V
S
 
Q
K
 
G
V
 
A
D
 
K
A
 
V
L
 
V
I
 
I
I
 
V
A
 
A
P
 
P
A
 
T
D
 
D
S
 
S
K
 
K
A
 
A
M
 
L
V
 
A
P
 
G
V
 
A
I
 
A
K
 
D
K
 
D
A
 
L
V
 
V
D
 
E
A
 
Q
G
 
G
I
 
V
T
 
A
V
 
V
I
 
I
N
 
S
I
 
V
D
|
D
N
x
R
Q
 
N
L
 
-
D
 
-
P
 
-
A
 
-
V
 
-
V
 
I
K
 
A
S
 
G
K
 
G
N
 
K
I
 
T
N
 
A
V
 
V
P
 
P
F
 
H
V
 
V
G
 
G
P
 
A
D
 
D
N
 
N
R
 
V
K
 
A
G
 
G
A
 
G
R
 
R
L
 
A
V
 
M
G
 
A
E
 
D
Y
 
W
L
 
V
A
 
V
K
 
K
Q
 
T
L
 
Y
K
 
P
A
 
A
G
 
G
D
 
A
E
 
R
V
 
V
G
 
V
I
 
V
I
 
I
E
 
T
G
x
N
V
x
D
S
 
P
T
 
G
T
 
S
T
 
S
N
x
S
A
 
S
Q
 
I
A
 
E
R
|
R
T
 
V
A
 
K
G
 
G
F
 
V
K
 
H
D
 
D
A
 
G
M
 
L
E
 
A
A
 
A
A
 
G
-
 
G
-
 
P
Q
 
A
V
 
F
K
 
K
V
 
I
V
 
V
S
 
T
L
 
E
Q
 
Q
S
 
T
G
 
A
-
 
N
-
x
S
-
 
K
-
 
R
D
 
D
W
 
Q
E
 
A
I
 
L
N
 
T
K
 
V
G
 
T
N
 
Q
Q
 
N
V
 
I
A
 
L
A
 
T
S
 
S
M
 
M
L
 
R
S
 
D
E
 
T
Y
 
P
P
 
P
N
 
D
I
 
V
K
 
-
A
 
-
L
 
I
L
 
L
A
 
C
G
 
L
N
|
N
D
 
D
S
 
D
M
 
M
A
 
A
V
 
M
G
 
G
A
 
A
V
 
L
S
 
E
A
 
A
V
 
V
R
 
R
A
 
A
A
 
A
G
 
G
-
 
L
K
 
D
A
 
S
G
 
A
K
 
K
V
 
V
Q
 
K
V
 
V
V
 
I
G
 
G
Y
 
F
D
|
D
N
 
A
I
 
I
N
 
P
A
 
E
I
 
A
K
 
L
P
 
A
M
 
R
L
 
I
K
 
K
D
 
A
G
 
G
R
 
E
V
 
M
L
 
V
A
 
A
T
 
T
A
 
V
D
 
E
Q
|
Q
F
 
N
A
 
P
A
 
G
K
 
L
Q
 
Q
A
 
-
V
 
-
F
 
-
G
 
-
I
 
I
E
 
R
T
 
T
A
 
A
L
 
L
K
 
R
M
 
Q
L
 
A
K
 
V
G
 
-
E
 
D
K
 
K
V
 
I
D
 
K
S
 
S
G
 
G

Query Sequence

>AO356_00970 AO356_00970 LacI family transcriptional regulator
MKLPFAGRLLAVAMLAAASAALPISSAFAQTAEKPKVALVMKSLANEFFLTMEDGAKAYQ
KEHSADFDLISNGIKDETDTANQIRIVEQMIVSKVDALIIAPADSKAMVPVIKKAVDAGI
TVINIDNQLDPAVVKSKNINVPFVGPDNRKGARLVGEYLAKQLKAGDEVGIIEGVSTTTN
AQARTAGFKDAMEAAQVKVVSLQSGDWEINKGNQVAASMLSEYPNIKALLAGNDSMAVGA
VSAVRAAGKAGKVQVVGYDNINAIKPMLKDGRVLATADQFAAKQAVFGIETALKMLKGEK
VDSGTNGVIETPVELVTKP

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory