SitesBLAST – Find functional sites

 

SitesBLAST

Comparing SM_b20712 FitnessBrowser__Smeli:SM_b20712 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

4yo7A Crystal structure of an abc transporter solute binding protein (ipr025997) from bacillus halodurans c-125 (bh2323, target efi- 511484) with bound myo-inositol
47% identity, 93% coverage: 23:308/309 of query aligns to 9:286/287 of 4yo7A

query
sites
4yo7A
I
 
I
G
 
G
V
 
V
S
 
S
M
 
I
A
 
S
L
 
N
F
 
L
D
|
D
D
 
E
N
 
-
F
 
F
L
 
L
T
 
T
V
 
Y
L
 
M
R
 
Q
S
 
D
G
 
A
M
 
M
Q
 
K
E
 
E
Y
 
E
A
 
A
K
 
A
T
 
N
L
 
Y
D
 
P
G
 
D
V
 
F
E
 
E
L
 
F
Q
 
I
V
 
F
E
 
S
D
 
D
A
 
A
Q
 
Q
N
 
N
D
 
D
V
 
S
A
 
T
K
 
Q
Q
 
Q
Q
 
M
S
 
A
Q
 
Q
I
 
V
Q
 
E
N
 
N
F
 
F
I
 
I
A
 
S
A
 
R
G
 
N
V
 
V
D
 
D
A
 
A
I
 
I
I
 
I
V
 
V
N
 
N
P
 
P
V
 
V
D
 
D
T
 
T
D
 
T
A
 
S
T
 
A
A
 
V
A
 
D
M
 
I
S
 
V
K
 
N
I
 
M
A
 
V
A
 
N
D
 
D
A
 
A
G
 
G
I
 
I
P
 
P
L
 
I
V
 
I
Y
 
I
V
 
A
N
|
N
R
|
R
E
 
-
P
 
-
V
 
-
N
 
T
V
 
F
D
 
D
T
 
G
L
 
V
P
 
D
D
 
Q
K
 
A
Q
 
T
A
 
A
F
 
F
V
 
V
A
 
G
S
 
S
N
 
E
E
 
S
Q
 
I
E
 
Q
S
 
S
G
 
G
T
 
L
L
 
L
Q
 
Q
T
 
M
K
 
E
E
 
E
I
 
V
C
 
A
K
 
K
M
 
L
L
 
L
G
 
N
G
 
N
K
 
E
G
 
G
K
 
N
A
 
I
V
 
A
V
 
I
M
 
M
M
 
D
G
 
G
E
 
E
L
 
L
S
 
G
N
 
H
Q
 
E
A
 
A
A
 
Q
R
 
I
M
 
M
R
|
R
T
 
T
K
 
E
D
 
G
I
 
N
H
 
K
D
 
Q
V
 
I
I
 
I
A
 
-
T
 
-
D
 
E
E
 
E
C
 
H
K
 
D
G
 
G
I
 
L
E
 
E
I
 
V
V
 
V
E
 
L
E
 
Q
Q
 
G
T
 
T
A
 
A
N
 
K
W
 
F
S
 
D
R
 
R
T
 
S
Q
 
E
G
 
G
S
 
M
D
 
R
L
 
L
M
 
M
T
 
E
N
 
N
W
 
W
L
 
L
S
 
N
A
 
S
G
 
G
L
 
T
E
 
E
F
 
I
D
 
D
A
 
A
V
 
V
I
 
V
S
 
A
N
 
N
N
|
N
D
 
D
E
 
E
M
 
M
A
 
A
I
 
L
G
 
G
A
 
A
I
 
I
Q
 
L
A
 
A
L
 
L
K
 
E
A
 
A
A
 
V
G
 
G
R
 
K
S
 
-
M
x
L
D
 
D
S
 
D
V
|
V
V
 
I
I
 
V
G
 
A
G
 
G
I
 
I
D
|
D
A
 
A
T
 
T
Q
 
P
D
 
A
A
 
A
L
 
L
A
 
E
A
 
A
M
 
M
A
 
K
A
 
E
G
 
G
D
 
K
L
 
L
D
 
D
V
 
V
T
 
T
V
 
V
F
 
F
Q
|
Q
N
 
D
A
 
A
A
 
K
G
 
G
Q
 
Q
G
 
G
K
 
A
G
 
T
S
 
S
V
 
V
D
 
K
A
 
V
A
 
A
L
 
V
K
 
Q
L
 
A
A
 
A
K
 
N
G
 
G
E
 
E
P
 
D
V
 
V
E
 
E
K
 
D
K
 
A
V
 
M
Y
 
-
I
 
I
P
 
P
F
 
Y
E
 
E
L
 
L
V
 
V
T
 
T
K
 
P
D
 
E
N
 
N
L
 
V
A
 
E
Q
 
E
Y
 
Y
Q
 
E
T
 
A
K
 
K

2ioyA Crystal structure of thermoanaerobacter tengcongensis ribose binding protein (see paper)
35% identity, 91% coverage: 21:302/309 of query aligns to 1:273/274 of 2ioyA

query
sites
2ioyA
E
 
K
T
 
T
I
 
I
G
 
G
V
 
L
S
 
V
M
 
I
A
 
S
L
 
T
F
 
L
D
 
N
D
x
N
N
 
P
F
|
F
L
x
F
T
 
V
V
 
T
L
 
L
R
 
K
S
 
N
G
 
G
M
 
A
Q
 
E
E
 
E
Y
 
K
A
 
A
K
 
K
T
 
E
L
 
L
D
 
-
G
 
G
V
 
Y
E
 
K
L
 
I
Q
 
I
V
 
V
E
 
E
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
S
A
 
S
K
 
K
Q
 
E
Q
 
L
S
 
S
Q
 
N
I
 
V
Q
 
E
N
 
D
F
 
L
I
 
I
A
 
Q
A
 
Q
G
 
K
V
 
V
D
 
D
A
 
V
I
 
L
I
 
L
V
 
I
N
 
N
P
 
P
V
 
V
D
 
D
T
 
S
D
 
D
A
 
A
T
 
V
A
 
V
A
 
T
M
 
A
S
 
I
K
 
K
I
 
E
A
 
A
A
 
N
D
 
S
A
 
K
G
 
N
I
 
I
P
 
P
L
 
V
V
 
I
Y
 
T
V
 
I
N
x
D
R
|
R
E
 
S
P
 
A
V
 
N
N
 
G
V
 
G
D
 
D
T
 
V
L
 
V
P
 
-
D
 
-
K
 
-
Q
 
-
A
 
C
F
 
H
V
 
I
A
 
A
S
 
S
N
 
D
E
 
N
Q
 
V
E
 
K
S
 
G
G
 
G
T
 
E
L
 
M
Q
 
A
T
 
A
K
 
E
E
 
F
I
 
I
C
 
A
K
 
K
M
 
A
L
 
L
G
 
K
G
 
G
K
 
K
G
 
G
K
 
N
A
 
V
V
 
V
V
 
E
M
 
L
M
 
E
G
 
G
E
 
I
L
 
P
S
 
G
N
 
A
Q
 
S
A
|
A
A
 
A
R
 
R
M
 
D
R
|
R
T
 
G
K
 
K
D
 
G
I
 
F
H
 
D
D
 
E
V
 
A
I
 
I
A
 
A
T
 
-
D
 
-
E
 
K
C
 
Y
K
 
P
G
 
D
I
 
I
E
 
K
I
 
I
V
 
V
E
 
A
E
 
K
Q
 
Q
T
 
A
A
 
A
N
 
D
W
x
F
S
 
D
R
 
R
T
 
S
Q
 
K
G
 
G
S
 
L
D
 
S
L
 
V
M
 
M
T
 
E
N
 
N
W
 
I
L
 
L
S
 
Q
A
 
A
G
 
Q
L
 
P
E
 
K
F
 
I
D
 
D
A
 
A
V
 
V
I
 
F
S
 
A
N
 
Q
N
|
N
D
 
D
E
 
E
M
 
M
A
 
A
I
 
L
G
 
G
A
 
A
I
 
I
Q
 
K
A
 
A
L
 
I
K
 
E
A
 
A
A
 
A
G
 
N
R
 
R
S
 
Q
M
 
-
D
 
-
S
 
G
V
 
I
V
 
I
I
 
V
G
 
V
G
 
G
I
 
F
D
|
D
A
 
G
T
 
T
Q
 
E
D
 
D
A
 
A
L
 
L
A
 
K
A
 
A
M
 
I
A
 
K
A
 
E
G
 
G
D
 
K
L
 
M
D
 
A
V
 
A
T
 
T
V
 
I
F
 
A
Q
|
Q
N
 
Q
A
 
P
A
 
A
G
 
L
Q
 
M
G
 
G
K
 
S
G
 
L
S
 
G
V
 
V
D
 
E
A
 
M
A
 
A
L
 
D
K
 
K
L
 
Y
A
 
L
K
 
K
G
 
G
E
 
E
P
 
K
V
 
I
E
 
P
K
 
N
K
 
F
V
 
I
Y
 
P
I
 
A
P
 
E
F
 
L
E
 
K
L
 
L
V
 
I
T
 
T
K
 
K
D
 
E
N
 
N
L
 
V

A0QYB5 D-threitol-binding protein from Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) (Mycobacterium smegmatis) (see paper)
38% identity, 93% coverage: 17:302/309 of query aligns to 29:307/349 of A0QYB5

query
sites
A0QYB5
A
 
A
A
 
A
H
 
N
A
 
S
E
 
D
T
 
T
I
 
T
G
 
R
V
 
I
S
 
G
M
 
V
A
 
T
L
 
V
F
x
Y
D
 
D
-
 
M
D
 
S
N
 
S
F
 
F
L
 
I
T
 
T
V
 
A
L
 
G
R
 
K
S
 
E
G
 
G
M
 
M
Q
 
D
E
 
A
Y
 
Y
A
 
A
K
 
K
T
 
D
L
 
-
D
 
N
G
 
N
V
 
I
E
 
E
L
 
L
Q
 
I
V
 
W
E
 
N
D
 
S
A
 
A
Q
 
N
N
 
L
D
 
D
V
 
V
A
 
S
K
 
T
Q
 
Q
Q
 
A
S
 
S
Q
 
Q
I
 
V
Q
 
D
N
 
S
F
 
M
I
 
I
A
 
N
A
 
Q
G
 
G
V
 
V
D
 
D
A
 
A
I
 
I
I
 
I
V
 
V
N
 
V
P
 
P
V
 
V
D
 
Q
T
 
A
D
 
D
A
 
S
T
 
L
A
 
A
A
 
P
M
 
Q
S
 
V
K
 
A
I
 
S
A
 
A
A
 
K
D
 
A
A
 
K
G
 
G
I
 
I
P
 
P
L
 
L
V
 
V
Y
 
P
V
 
V
N
|
N
R
 
A
E
 
A
P
 
-
V
 
-
N
 
-
V
 
L
D
 
D
T
 
S
L
 
-
P
 
K
D
 
D
K
 
I
Q
 
A
A
 
G
F
 
N
V
 
V
A
 
Q
S
 
P
N
 
D
E
 
D
Q
 
V
E
 
A
S
 
A
G
 
G
T
 
A
L
 
Q
Q
 
E
T
 
M
K
 
Q
E
 
M
I
 
M
C
 
A
K
 
D
M
 
R
L
 
L
G
 
G
G
 
G
K
 
K
G
 
G
K
 
N
A
 
I
V
 
V
V
 
I
M
 
L
M
 
Q
G
 
G
E
 
P
L
 
L
S
 
G
N
 
Q
Q
 
S
A
 
G
A
 
E
R
 
L
M
 
D
R
|
R
T
 
S
K
 
K
D
 
G
I
 
I
H
 
E
D
 
Q
V
 
V
I
 
L
A
 
A
T
 
-
D
 
-
E
 
K
C
 
Y
K
 
P
G
 
D
I
 
I
E
 
K
I
 
V
V
 
L
E
 
A
E
 
K
Q
 
D
T
 
T
A
 
A
N
 
N
W
 
W
S
 
K
R
 
R
T
 
D
Q
 
E
G
 
A
S
 
V
D
 
N
L
 
K
M
 
M
T
 
K
N
 
N
W
 
W
L
 
I
S
 
S
A
 
G
-
 
F
G
 
G
L
 
P
E
 
Q
F
 
I
D
 
D
A
 
G
V
 
V
I
 
V
S
 
A
N
 
Q
N
|
N
D
 
D
E
 
D
M
 
M
A
 
G
I
 
L
G
 
G
A
 
A
I
 
L
Q
 
Q
A
 
A
L
 
L
K
 
K
A
 
E
A
 
S
G
 
G
R
 
R
S
 
T
M
 
-
D
 
-
S
 
G
V
 
V
V
 
P
I
 
I
G
 
V
G
 
G
I
 
I
D
|
D
A
 
G
T
 
I
Q
 
E
D
 
D
A
 
G
L
 
L
A
 
N
A
 
A
M
 
V
A
 
K
A
 
S
G
 
G
D
 
D
L
 
F
D
 
I
V
 
G
T
 
T
V
 
S
F
 
L
Q
|
Q
N
 
N
A
 
G
A
 
T
G
 
V
Q
 
E
G
 
L
K
 
A
G
 
A
S
 
G
V
 
L
D
 
A
A
 
V
A
 
A
L
 
N
K
 
R
L
 
L
A
 
A
K
 
K
G
 
G
E
 
E
P
 
P
V
 
V
E
 
N
K
 
K
K
 
E
-
 
P
V
 
V
Y
 
Y
I
 
I
P
 
-
F
 
M
E
 
P
L
 
A
V
 
I
T
 
T
K
 
K
D
 
D
N
 
N
L
 
V

5kwsA Crystal structure of galactose binding protein from yersinia pestis in the complex with beta d glucose
37% identity, 93% coverage: 20:305/309 of query aligns to 1:306/307 of 5kwsA

query
sites
5kwsA
A
 
A
E
 
E
T
 
T
-
 
R
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
S
 
K
G
 
A
M
 
I
Q
 
E
E
 
K
Y
 
D
A
 
A
K
 
K
T
 
A
L
 
S
D
 
P
G
 
E
V
 
I
E
 
T
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
A
 
K
G
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
P
A
 
V
M
 
V
S
 
I
K
 
D
I
 
K
A
 
A
A
 
R
D
 
S
A
 
N
G
 
D
I
 
I
P
 
P
L
 
I
V
 
V
Y
 
F
V
 
Y
N
|
N
R
x
K
E
 
E
P
 
P
V
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
T
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
V
L
 
I
Q
 
Q
T
 
G
K
 
E
E
 
L
I
 
I
C
 
A
K
 
K
M
 
H
L
 
W
-
 
Q
-
 
A
-
 
N
-
 
P
-
 
E
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
G
x
D
G
 
G
K
|
K
G
 
I
K
x
Q
A
 
F
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
K
 
T
D
 
-
I
 
-
H
 
-
D
 
Y
V
 
V
I
 
I
A
 
K
T
 
T
D
 
L
E
 
N
C
 
E
K
 
K
G
 
G
I
 
L
E
 
P
I
 
T
V
 
Q
E
 
Q
E
 
L
Q
 
Q
-
 
L
-
 
D
T
 
T
A
 
A
N
 
M
W
|
W
S
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
S
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
A
 
G
-
 
P
-
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
R
 
K
S
 
T
M
 
-
D
 
-
S
 
S
V
 
V
V
 
P
I
 
V
G
 
F
G
 
G
I
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
A
 
K
A
 
S
G
 
G
D
 
Q
L
 
M
D
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
N
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
S
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
A
G
 
G
E
 
K
P
 
P
-
 
A
-
 
A
-
 
E
-
 
G
-
 
T
-
 
T
-
 
W
-
 
K
V
 
I
E
 
E
K
 
N
K
 
K
-
 
I
V
 
V
Y
 
R
I
 
I
P
 
P
F
 
Y
E
 
V
L
 
G
V
 
V
T
 
D
K
 
K
D
 
D
N
 
N
L
 
L
A
 
A
Q
 
E
Y
 
F

P0AEE5 D-galactose/methyl-galactoside binding periplasmic protein MglB; D-galactose-binding periplasmic protein; GBP; D-galactose/D-glucose-binding protein; GGBP from Escherichia coli (strain K12) (see 4 papers)
35% identity, 99% coverage: 2:308/309 of query aligns to 4:332/332 of P0AEE5

query
sites
P0AEE5
K
|
K
K
x
V
F
x
L
F
x
T
L
|
L
G
x
S
T
x
A
A
x
V
M
|
M
A
|
A
-
x
S
V
x
M
L
|
L
M
x
F
S
x
G
T
x
A
A
|
A
A
|
A
H
|
H
A
|
A
-
 
A
-
 
D
E
 
T
T
 
R
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
S
 
K
G
 
A
M
 
I
Q
 
E
E
 
Q
Y
 
D
A
 
A
K
 
K
T
 
A
L
 
A
D
 
P
G
 
D
V
 
V
E
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
A
 
K
G
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
M
 
V
S
 
I
K
 
E
I
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
G
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
 
K
E
 
E
P
 
P
V
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
T
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
I
L
 
I
Q
 
Q
T
 
G
K
 
D
E
 
L
I
 
I
C
 
A
K
 
K
M
 
H
L
 
W
G
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
-
x
D
G
 
G
K
x
Q
G
 
I
K
x
Q
A
 
F
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
-
 
T
-
 
Y
-
 
V
-
 
I
K
 
K
D
 
E
I
 
L
H
 
N
D
 
D
V
 
-
I
 
-
A
 
-
T
 
-
D
 
-
E
 
-
C
 
-
K
 
K
G
 
G
I
 
I
E
 
K
I
 
T
V
 
E
E
 
Q
E
 
L
Q
 
Q
-
 
L
-
 
D
T
 
T
A
 
A
N
 
M
W
 
W
S
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
S
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
A
 
G
-
 
P
-
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
R
 
K
S
 
S
M
 
-
D
 
-
S
 
S
V
 
I
V
 
P
I
 
V
G
 
F
G
 
G
I
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
A
 
K
A
 
S
G
 
G
D
 
A
L
 
L
D
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
N
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
S
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
D
G
 
G
E
 
K
P
 
G
V
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
N
-
 
W
-
 
K
-
 
I
-
 
D
E
 
N
K
 
K
K
 
V
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
E
 
V
L
 
G
V
 
V
T
 
D
K
 
K
D
 
D
N
 
N
L
 
L
A
 
A
Q
 
E
Y
 
F
Q
 
S
T
 
K
K
 
K

Sites not aligning to the query:

A0QYB3 Xylitol-binding protein from Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) (Mycobacterium smegmatis) (see paper)
36% identity, 93% coverage: 16:302/309 of query aligns to 28:307/349 of A0QYB3

query
sites
A0QYB3
T
 
T
A
 
A
A
 
A
H
 
N
A
 
S
E
 
D
T
 
T
I
 
K
G
 
R
V
 
I
S
 
G
M
 
V
A
 
T
L
 
V
F
x
Y
D
 
D
-
 
M
D
 
S
N
 
S
F
 
F
L
 
I
T
 
T
V
 
E
L
 
G
R
 
K
S
 
E
G
 
G
M
 
M
Q
 
D
E
 
T
Y
 
Y
A
 
A
K
 
K
T
 
A
L
 
-
D
 
N
G
 
N
V
 
I
E
 
E
L
 
L
Q
 
V
V
 
W
E
 
N
D
 
S
A
 
A
Q
 
N
N
 
N
D
 
D
V
 
V
A
 
S
K
 
T
Q
 
Q
Q
 
A
S
 
S
Q
 
Q
I
 
V
Q
 
D
N
 
S
F
 
L
I
 
I
A
 
N
A
 
Q
G
 
G
V
 
V
D
 
D
A
 
A
I
 
I
I
 
I
V
 
V
N
 
V
P
 
P
V
 
V
D
 
Q
T
 
A
D
 
D
A
 
S
T
 
L
A
 
G
A
 
P
M
 
Q
S
 
V
K
 
A
I
 
S
A
 
A
A
 
K
D
 
S
A
 
K
G
 
G
I
 
I
P
 
P
L
 
L
V
 
L
Y
 
A
V
 
V
N
|
N
R
 
A
E
 
A
P
 
-
V
 
-
N
 
-
V
 
L
D
 
E
T
 
T
L
 
-
P
 
P
D
 
D
K
 
L
Q
 
A
A
 
G
F
 
N
V
 
V
A
 
Q
S
 
P
N
 
D
E
 
D
Q
 
V
E
 
A
S
 
A
G
 
G
T
 
A
L
 
Q
Q
 
E
T
 
M
K
 
Q
E
 
M
I
 
M
C
 
A
K
 
D
M
 
R
L
 
L
G
 
G
G
 
G
K
 
K
G
 
G
K
 
N
A
 
I
V
 
V
V
 
I
M
 
L
M
 
Q
G
 
G
E
 
P
L
 
L
S
 
G
N
 
G
Q
 
S
A
 
G
A
 
E
R
 
I
M
 
N
R
|
R
T
 
G
K
 
K
D
 
G
I
 
I
H
 
D
D
 
Q
V
 
V
I
 
L
A
 
A
T
 
-
D
 
-
E
 
K
C
 
Y
K
 
P
G
 
D
I
 
I
E
 
K
I
 
V
V
 
L
E
 
A
E
 
K
Q
 
D
T
 
T
A
 
A
N
 
N
W
 
W
S
 
K
R
 
R
T
 
D
Q
 
E
G
 
A
S
 
V
D
 
N
L
 
K
M
 
M
T
 
K
N
 
N
W
 
W
L
 
I
S
 
S
A
 
S
-
 
F
G
 
G
L
 
P
E
 
Q
F
 
I
D
 
D
A
 
G
V
 
V
I
 
V
S
 
A
N
 
Q
N
|
N
D
 
D
E
 
D
M
 
M
A
 
G
I
 
L
G
 
G
A
 
A
I
 
L
Q
 
Q
A
 
A
L
 
L
K
 
K
A
 
E
A
 
A
G
 
G
R
 
R
S
 
T
M
 
-
D
 
-
S
 
G
V
 
V
V
 
P
I
 
I
G
 
V
G
 
G
I
 
I
D
|
D
A
 
G
T
 
I
Q
 
E
D
 
D
A
 
G
L
 
L
A
 
N
A
 
A
M
 
V
A
 
K
A
 
S
G
 
G
D
 
D
L
 
F
D
 
I
V
 
G
T
 
T
V
 
S
F
 
L
Q
|
Q
N
 
N
A
 
G
A
 
T
G
 
V
Q
 
E
G
 
L
K
 
S
G
 
A
S
 
G
V
 
L
D
 
A
A
 
V
A
 
A
L
 
D
K
 
A
L
 
L
A
 
V
K
 
K
G
 
G
E
 
E
P
 
D
V
 
V
E
 
K
K
 
T
K
 
D
V
 
P
Y
 
V
I
 
Y
P
 
V
F
 
M
E
 
P
L
 
A
V
 
I
T
 
T
K
 
K
D
 
D
N
 
N
L
 
V

4rsmA Crystal structure of carbohydrate transporter msmeg_3599 from mycobacterium smegmatis str. Mc2 155, target efi-510970, in complex with d-threitol (see paper)
38% identity, 91% coverage: 21:302/309 of query aligns to 1:275/315 of 4rsmA

query
sites
4rsmA
E
 
D
T
 
T
I
 
T
G
 
R
V
 
I
S
 
G
M
 
V
A
 
T
L
 
V
F
x
Y
D
 
D
-
 
M
D
 
S
N
 
S
F
 
F
L
 
I
T
 
T
V
 
A
L
 
G
R
 
K
S
 
E
G
 
G
M
 
M
Q
 
D
E
 
A
Y
 
Y
A
 
A
K
 
K
T
 
D
L
 
-
D
 
N
G
 
N
V
 
I
E
 
E
L
 
L
Q
 
I
V
 
W
E
 
N
D
 
S
A
 
A
Q
 
N
N
 
L
D
 
D
V
 
V
A
 
S
K
 
T
Q
 
Q
Q
 
A
S
 
S
Q
 
Q
I
 
V
Q
 
D
N
 
S
F
 
M
I
 
I
A
 
N
A
 
Q
G
 
G
V
 
V
D
 
D
A
 
A
I
 
I
I
 
I
V
 
V
N
 
V
P
 
P
V
 
V
D
 
Q
T
 
A
D
 
D
A
 
S
T
 
L
A
 
A
A
 
P
M
 
Q
S
 
V
K
 
A
I
 
S
A
 
A
A
 
K
D
 
A
A
 
K
G
 
G
I
 
I
P
 
P
L
 
L
V
 
V
Y
 
P
V
 
V
N
|
N
R
 
A
E
 
A
P
 
-
V
 
-
N
 
-
V
 
L
D
 
D
T
 
S
L
 
-
P
 
K
D
 
D
K
 
I
Q
 
A
A
 
G
F
 
N
V
 
V
A
 
Q
S
 
P
N
 
D
E
 
D
Q
 
V
E
 
A
S
 
A
G
 
G
T
 
A
L
 
Q
Q
 
E
T
 
M
K
 
Q
E
 
M
I
 
M
C
 
A
K
 
D
M
 
R
L
 
L
G
 
G
G
 
G
K
 
K
G
 
G
K
 
N
A
 
I
V
 
V
V
 
I
M
 
L
M
 
Q
G
 
G
E
 
P
L
 
L
S
 
G
N
 
Q
Q
 
S
A
 
G
A
 
E
R
 
L
M
 
D
R
|
R
T
 
S
K
 
K
D
 
G
I
 
I
H
 
E
D
 
Q
V
 
V
I
 
L
A
 
A
T
 
-
D
 
-
E
 
K
C
 
Y
K
 
P
G
 
D
I
 
I
E
 
K
I
 
V
V
 
L
E
 
A
E
 
K
Q
 
D
T
 
T
A
 
A
N
 
N
W
|
W
S
 
K
R
 
R
T
 
D
Q
 
E
G
 
A
S
 
V
D
 
N
L
 
K
M
 
M
T
 
K
N
 
N
W
 
W
L
 
I
S
 
S
A
 
G
-
 
F
G
 
G
L
 
P
E
 
Q
F
 
I
D
 
D
A
 
G
V
 
V
I
 
V
S
 
A
N
 
Q
N
|
N
D
 
D
E
 
D
M
 
M
A
 
G
I
 
L
G
 
G
A
 
A
I
 
L
Q
 
Q
A
 
A
L
 
L
K
 
K
A
 
E
A
 
S
G
 
G
R
 
R
S
 
T
M
 
-
D
 
-
S
 
G
V
 
V
V
 
P
I
 
I
G
 
V
G
 
G
I
 
I
D
|
D
A
 
G
T
 
I
Q
 
E
D
 
D
A
 
G
L
 
L
A
 
N
A
 
A
M
 
V
A
 
K
A
 
S
G
 
G
D
 
D
L
 
F
D
 
I
V
 
G
T
 
T
V
 
S
F
 
L
Q
|
Q
N
 
N
A
 
G
A
 
T
G
 
V
Q
 
E
G
 
L
K
 
A
G
 
A
S
 
G
V
 
L
D
 
A
A
 
V
A
 
A
L
 
N
K
 
R
L
 
L
A
 
A
K
 
K
G
 
G
E
 
E
P
 
P
V
 
V
E
 
N
K
 
K
K
 
E
-
 
P
V
 
V
Y
 
Y
I
 
I
P
 
-
F
 
M
E
 
P
L
 
A
V
 
I
T
 
T
K
 
K
D
 
D
N
 
N
L
 
V

P23905 D-galactose/methyl-galactoside binding periplasmic protein MglB; D-galactose-binding periplasmic protein; GBP; D-galactose/D-glucose-binding protein; GGBP from Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720) (see 2 papers)
35% identity, 99% coverage: 2:308/309 of query aligns to 4:332/332 of P23905

query
sites
P23905
K
 
K
K
 
V
F
 
L
F
 
T
L
 
L
G
 
S
T
 
A
A
 
V
M
 
M
A
 
A
V
 
S
L
 
L
M
 
L
S
 
F
T
 
G
A
 
A
-
 
H
A
 
A
H
 
H
A
 
A
-
 
A
-
 
D
E
 
T
T
 
R
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
S
 
K
G
 
A
M
 
I
Q
 
E
E
 
K
Y
 
D
A
 
G
K
 
K
T
 
S
L
 
A
D
 
P
G
 
D
V
 
V
E
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
A
 
K
G
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
M
 
V
S
 
I
K
 
E
I
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
G
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
 
K
E
 
E
P
 
P
V
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
T
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
V
L
 
I
Q
 
Q
T
 
G
K
 
D
E
 
L
I
 
I
C
 
A
K
 
K
M
 
H
L
 
W
-
 
Q
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
G
x
D
G
 
G
K
|
K
G
 
I
K
x
Q
A
 
Y
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
-
 
T
-
 
Y
-
 
V
-
 
V
K
 
K
D
 
E
I
 
L
H
 
N
D
 
D
V
 
-
I
 
-
A
 
-
T
 
-
D
 
-
E
 
-
C
 
-
K
 
K
G
 
G
I
 
I
-
 
Q
-
 
T
E
 
E
I
 
Q
V
 
L
E
 
A
E
 
L
Q
 
D
T
 
T
A
 
A
N
 
M
W
 
W
S
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
S
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
A
 
G
-
 
P
-
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
R
 
K
S
 
S
M
 
-
D
 
-
S
 
S
V
 
I
V
 
P
I
 
V
G
 
F
G
 
G
I
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
A
 
K
A
 
S
G
 
G
D
 
A
L
 
M
D
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
N
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
S
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
E
G
 
G
E
 
K
-
 
G
-
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
S
-
 
W
P
 
K
V
 
I
E
 
E
K
 
N
K
 
K
-
 
I
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
E
 
V
L
 
G
V
 
V
T
 
D
K
 
K
D
 
D
N
 
N
L
 
L
A
 
S
Q
 
E
Y
 
F
Q
 
T
T
 
Q
K
 
K

2gbpA Sugar and signal-transducer binding sites of the escherichia coli galactose chemoreceptor protein (see paper)
35% identity, 93% coverage: 23:308/309 of query aligns to 5:309/309 of 2gbpA

query
sites
2gbpA
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
S
 
K
G
 
A
M
 
I
Q
 
E
E
 
Q
Y
 
D
A
 
A
K
 
K
T
 
A
L
 
A
D
 
P
G
 
D
V
 
V
E
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
A
 
K
G
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
M
 
V
S
 
I
K
 
E
I
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
G
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
x
K
E
 
E
P
 
P
V
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
T
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
I
L
 
I
Q
 
Q
T
 
G
K
 
D
E
 
L
I
 
I
C
 
A
K
 
K
M
 
H
L
 
W
G
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
-
x
D
G
 
G
K
x
Q
G
 
I
K
x
Q
A
 
F
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
-
 
T
-
 
Y
-
 
V
-
 
I
K
 
K
D
 
E
I
 
L
H
 
N
D
 
D
V
 
-
I
 
-
A
 
-
T
 
-
D
 
-
E
 
-
C
 
-
K
 
K
G
 
G
I
 
I
E
 
K
I
 
T
V
 
E
E
 
Q
E
 
L
Q
 
Q
-
 
L
-
 
D
T
 
T
A
 
A
N
 
M
W
|
W
S
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
S
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
A
 
G
-
 
P
-
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
R
 
K
S
 
S
M
 
-
D
 
-
S
 
S
V
 
I
V
 
P
I
 
V
G
 
F
G
 
G
I
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
A
 
K
A
 
S
G
 
G
D
 
A
L
 
L
D
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
N
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
S
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
D
G
 
G
E
 
K
P
 
G
V
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
N
-
 
W
-
 
K
-
 
I
-
 
D
E
 
N
K
 
K
K
 
V
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
E
 
V
L
 
G
V
 
V
T
 
D
K
 
K
D
 
D
N
 
N
L
 
L
A
 
A
Q
 
E
Y
 
F
Q
 
S
T
 
K
K
 
K

7e7mC Crystal structure analysis of the streptococcus agalactiae ribose binding protein rbsb
34% identity, 92% coverage: 23:305/309 of query aligns to 11:282/284 of 7e7mC

query
sites
7e7mC
I
 
L
G
 
G
V
 
V
S
 
S
M
 
I
A
 
S
L
 
T
F
 
T
D
 
N
D
x
N
N
 
P
F
x
Y
L
x
F
T
 
V
V
 
A
L
 
M
R
 
K
S
 
D
G
 
G
M
 
I
Q
 
D
E
 
K
Y
 
Y
A
 
A
K
 
S
T
 
N
L
 
-
D
 
K
G
 
K
V
 
I
E
 
S
L
 
I
Q
 
K
V
 
V
E
 
A
D
 
D
A
 
A
Q
 
Q
N
 
D
D
 
D
V
 
A
A
 
A
K
 
R
Q
 
Q
Q
 
A
S
 
D
Q
 
D
I
 
V
Q
 
Q
N
 
N
F
 
F
I
 
I
A
 
S
A
 
Q
G
 
N
V
 
V
D
 
D
A
 
A
I
 
I
I
 
L
V
 
I
N
 
N
P
 
P
V
 
V
D
 
D
T
 
S
D
 
K
A
 
A
T
 
I
A
 
V
A
 
T
M
 
A
S
 
I
K
 
K
I
 
S
A
 
A
A
 
N
D
 
N
A
 
A
G
 
N
I
 
I
P
 
P
L
 
V
V
 
I
Y
 
L
V
 
M
N
x
D
R
|
R
E
 
G
P
 
S
V
 
E
N
 
G
V
 
G
D
 
K
T
 
V
L
 
L
P
 
-
D
 
-
K
 
-
Q
 
-
A
 
T
F
 
T
V
 
V
A
 
A
S
 
S
N
 
D
E
 
N
Q
 
V
E
 
A
S
 
A
G
 
G
T
 
K
L
 
M
Q
 
A
T
 
A
K
 
D
E
 
Y
I
 
A
C
 
V
K
 
K
M
 
K
L
 
L
G
 
G
G
 
K
K
 
K
G
 
A
K
 
K
A
 
A
V
 
F
V
 
E
M
 
L
M
 
S
G
 
G
E
 
V
L
 
P
S
 
G
N
 
A
Q
 
S
A
 
A
A
 
T
R
 
V
M
 
D
R
|
R
T
 
G
K
 
K
D
 
G
I
 
F
H
 
H
D
 
S
V
 
V
I
 
A
A
 
K
T
 
S
D
 
K
E
 
-
C
 
-
K
 
-
G
 
-
I
 
L
E
 
D
I
 
M
V
 
L
E
 
S
E
 
S
Q
 
Q
T
 
S
A
 
A
N
 
N
W
x
F
S
 
D
R
 
R
T
 
A
Q
 
K
G
 
A
S
 
L
D
 
N
L
 
T
M
 
T
T
 
Q
N
 
N
W
 
M
L
 
I
S
 
Q
A
 
G
G
 
H
L
 
K
E
 
D
F
 
V
D
 
Q
A
 
I
V
 
I
I
 
F
S
 
A
N
 
Q
N
|
N
D
 
D
E
 
E
M
 
M
A
 
A
I
 
L
G
 
G
A
 
A
I
 
A
Q
 
Q
A
 
A
L
 
V
K
 
K
A
 
S
A
 
A
G
 
G
R
 
-
S
 
-
M
 
L
D
 
Q
S
 
N
V
 
V
V
 
L
I
 
I
G
 
V
G
 
G
I
 
I
D
|
D
A
 
G
T
 
Q
Q
 
P
D
 
D
A
 
A
L
 
H
A
 
D
A
 
A
M
 
I
A
 
K
A
 
K
G
 
G
D
 
D
L
 
I
D
 
S
V
 
A
T
 
T
V
 
I
F
 
A
Q
|
Q
N
 
Q
A
 
P
A
 
A
G
 
K
Q
 
M
G
 
G
K
 
E
G
 
I
S
 
A
V
 
I
D
 
Q
A
 
A
A
 
A
L
 
I
K
 
D
L
 
Y
A
 
Y
K
 
K
G
 
G
E
 
K
P
 
K
V
 
V
E
 
E
K
 
K
K
 
E
V
 
T
Y
 
I
I
 
S
P
 
P
F
 
I
E
 
Y
L
 
L
V
 
V
T
 
T
K
 
K
D
 
D
N
 
N
L
 
V
A
 
E
Q
 
K
Y
 
Y

1gcaA The 1.7 angstroms refined x-ray structure of the periplasmic glucose(slash)galactose receptor from salmonella typhimurium (see paper)
35% identity, 93% coverage: 23:308/309 of query aligns to 5:309/309 of 1gcaA

query
sites
1gcaA
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
|
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
S
 
K
G
 
A
M
 
I
Q
 
E
E
 
K
Y
 
D
A
 
G
K
 
K
T
 
S
L
 
A
D
 
P
G
 
D
V
 
V
E
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
A
 
K
G
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
M
 
V
S
 
I
K
 
E
I
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
G
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
x
K
E
 
E
P
 
P
V
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
T
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
V
L
 
I
Q
 
Q
T
 
G
K
 
D
E
 
L
I
 
I
C
 
A
K
 
K
M
 
H
L
 
W
-
 
Q
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
G
x
D
G
 
G
K
|
K
G
 
I
K
x
Q
A
 
Y
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
-
 
T
-
 
Y
-
 
V
-
 
V
K
 
K
D
 
E
I
 
L
H
 
N
D
 
D
V
 
-
I
 
-
A
 
-
T
 
-
D
 
-
E
 
-
C
 
-
K
 
K
G
 
G
I
 
I
-
 
Q
-
 
T
E
 
E
I
 
Q
V
 
L
E
 
A
E
 
L
Q
 
D
T
 
T
A
 
A
N
 
M
W
 
W
S
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
S
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
A
 
G
-
 
P
-
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
R
 
K
S
 
S
M
 
-
D
 
-
S
 
S
V
 
I
V
 
P
I
 
V
G
 
F
G
 
G
I
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
A
 
K
A
 
S
G
 
G
D
 
A
L
 
M
D
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
N
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
S
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
E
G
 
G
E
 
K
-
 
G
-
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
S
-
 
W
P
 
K
V
 
I
E
 
E
K
 
N
K
 
K
-
 
I
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
E
 
V
L
 
G
V
 
V
T
 
D
K
 
K
D
 
D
N
 
N
L
 
L
A
 
S
Q
 
E
Y
 
F
Q
 
T
T
 
Q
K
 
K

2qw1A Glucose/galactose binding protein bound to 3-o-methyl d-glucose (see paper)
35% identity, 92% coverage: 23:305/309 of query aligns to 4:305/305 of 2qw1A

query
sites
2qw1A
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
 
D
N
 
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
S
 
K
G
 
A
M
 
I
Q
 
E
E
 
Q
Y
 
D
A
 
A
K
 
K
T
 
A
L
 
A
D
 
P
G
 
D
V
 
V
E
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
A
 
K
G
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
M
 
V
S
 
I
K
 
E
I
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
G
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
 
N
R
 
K
E
 
E
P
 
P
V
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
T
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
I
L
 
I
Q
 
Q
T
 
G
K
 
D
E
 
L
I
 
I
C
 
A
K
 
K
M
 
H
L
 
W
G
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
-
x
D
G
 
G
K
x
Q
G
 
I
K
x
Q
A
 
F
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
 
D
A
 
A
R
 
E
M
 
A
R
 
R
T
 
T
-
 
T
-
 
Y
-
 
V
-
 
I
K
 
K
D
 
E
I
 
L
H
 
N
D
 
D
V
 
-
I
 
-
A
 
-
T
 
-
D
 
-
E
 
-
C
 
-
K
 
K
G
 
G
I
 
I
E
 
K
I
 
T
V
 
E
E
 
Q
E
 
L
Q
 
Q
-
 
L
-
 
D
T
 
T
A
 
A
N
 
M
W
|
W
S
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
S
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
A
 
G
-
 
P
-
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
R
 
K
S
 
S
M
 
-
D
 
-
S
 
S
V
 
I
V
 
P
I
 
V
G
 
F
G
 
G
I
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
A
 
K
A
 
S
G
 
G
D
 
A
L
 
L
D
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
 
N
N
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
S
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
D
G
 
G
E
 
K
P
 
G
V
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
N
-
 
W
-
 
K
-
 
I
-
 
D
E
 
N
K
 
K
K
 
V
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
E
 
V
L
 
G
V
 
V
T
 
D
K
 
K
D
 
D
N
 
N
L
 
L
A
 
A
Q
 
E
Y
 
F

5hkoA Crystal structure of abc transporter solute binding protein msmeg_3598 from mycobacterium smegmatis str. Mc2 155, target efi-510969, in complex with l-sorbitol
36% identity, 90% coverage: 25:302/309 of query aligns to 4:274/314 of 5hkoA

query
sites
5hkoA
V
 
I
S
 
G
M
 
V
A
 
T
L
x
V
F
x
Y
D
 
D
-
 
M
D
 
S
N
 
S
F
 
F
L
 
I
T
 
T
V
x
E
L
 
G
R
 
K
S
 
E
G
 
G
M
 
M
Q
 
D
E
 
T
Y
 
Y
A
 
A
K
 
K
T
 
A
L
 
-
D
 
N
G
 
N
V
 
I
E
 
E
L
 
L
Q
 
V
V
 
W
E
 
N
D
 
S
A
 
A
Q
 
N
N
 
N
D
|
D
V
 
V
A
x
S
K
 
T
Q
 
Q
Q
 
A
S
 
S
Q
 
Q
I
 
V
Q
 
D
N
 
S
F
 
L
I
 
I
A
 
N
A
 
Q
G
 
G
V
 
V
D
 
D
A
 
A
I
 
I
I
 
I
V
 
V
N
 
V
P
 
P
V
 
V
D
 
Q
T
 
A
D
 
D
A
 
S
T
 
L
A
 
G
A
 
P
M
 
Q
S
 
V
K
 
A
I
 
S
A
 
A
A
 
K
D
 
S
A
 
K
G
 
G
I
 
I
P
 
P
L
 
L
V
 
L
Y
 
A
V
 
V
N
|
N
R
x
A
E
 
A
P
 
-
V
 
-
N
 
-
V
 
L
D
 
E
T
 
T
L
 
-
P
 
P
D
 
D
K
 
L
Q
 
A
A
 
G
F
 
N
V
 
V
A
 
Q
S
 
P
N
 
D
E
 
D
Q
 
V
E
 
A
S
 
A
G
 
G
T
 
A
L
 
Q
Q
 
E
T
 
M
K
 
Q
E
 
M
I
 
M
C
 
A
K
 
D
M
 
R
L
 
L
G
 
G
G
 
G
K
 
K
G
 
G
K
 
N
A
 
I
V
 
V
V
 
I
M
 
L
M
 
Q
G
 
G
E
 
P
L
 
L
S
 
G
N
 
G
Q
 
S
A
 
G
A
 
E
R
 
I
M
 
N
R
|
R
T
 
G
K
 
K
D
 
G
I
 
I
H
 
D
D
 
Q
V
 
V
I
 
L
A
 
A
T
 
-
D
 
-
E
 
K
C
 
Y
K
 
P
G
 
D
I
 
I
E
 
K
I
 
V
V
 
L
E
 
A
E
 
K
Q
 
D
T
 
T
A
 
A
N
 
N
W
|
W
S
 
K
R
 
R
T
 
D
Q
 
E
G
 
A
S
 
V
D
 
N
L
 
K
M
 
M
T
 
K
N
 
N
W
 
W
L
 
I
S
 
S
A
 
S
-
 
F
G
 
G
L
 
P
E
 
Q
F
 
I
D
 
D
A
 
G
V
 
V
I
 
V
S
 
A
N
 
Q
N
|
N
D
 
D
E
 
D
M
 
M
A
 
G
I
 
L
G
 
G
A
 
A
I
 
L
Q
 
Q
A
 
A
L
 
L
K
 
K
A
 
E
A
 
A
G
 
G
R
 
R
S
 
T
M
 
-
D
 
-
S
 
G
V
 
V
V
 
P
I
 
I
G
 
V
G
 
G
I
 
I
D
|
D
A
 
G
T
 
I
Q
x
E
D
 
D
A
 
G
L
 
L
A
 
N
A
 
A
M
 
V
A
 
K
A
 
S
G
 
G
D
 
D
L
 
F
D
 
I
V
 
G
T
 
T
V
 
S
F
 
L
Q
|
Q
N
 
N
A
 
G
A
 
T
G
 
V
Q
 
E
G
 
L
K
 
S
G
 
A
S
 
G
V
 
L
D
 
A
A
 
V
A
 
A
L
 
D
K
 
A
L
 
L
A
 
V
K
 
K
G
 
G
E
 
E
P
 
D
V
 
V
E
 
K
K
 
T
K
 
D
V
 
P
Y
 
V
I
 
Y
P
 
V
F
 
M
E
 
P
L
 
A
V
 
I
T
 
T
K
 
K
D
 
D
N
 
N
L
 
V

3ga5A X-ray structure of glucose/galactose receptor from salmonella typhimurium in complex with (2r)-glyceryl-beta-d-galactopyranoside (see paper)
35% identity, 92% coverage: 23:305/309 of query aligns to 3:304/305 of 3ga5A

query
sites
3ga5A
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
|
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
S
 
K
G
 
A
M
 
I
Q
 
E
E
 
K
Y
 
D
A
 
G
K
 
K
T
 
S
L
 
A
D
 
P
G
 
D
V
 
V
E
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
A
 
K
G
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
M
 
V
S
 
I
K
 
E
I
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
G
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
x
K
E
 
E
P
 
P
V
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
T
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
x
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
V
L
 
I
Q
 
Q
T
 
G
K
 
D
E
 
L
I
 
I
C
 
A
K
 
K
M
 
H
L
 
W
-
 
Q
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
G
x
D
G
 
G
K
|
K
G
 
I
K
x
Q
A
 
Y
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
-
 
T
-
 
Y
-
 
V
-
 
V
K
 
K
D
 
E
I
 
L
H
 
N
D
 
D
V
 
-
I
 
-
A
 
-
T
 
-
D
 
-
E
 
-
C
 
-
K
 
K
G
 
G
I
 
I
-
 
Q
-
 
T
E
 
E
I
 
Q
V
 
L
E
 
A
E
 
L
Q
 
D
T
 
T
A
 
A
N
 
M
W
|
W
S
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
S
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
A
 
G
-
 
P
-
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
R
 
K
S
 
S
M
 
-
D
 
-
S
 
S
V
 
I
V
 
P
I
 
V
G
 
F
G
 
G
I
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
A
 
K
A
 
S
G
 
G
D
 
A
L
 
M
D
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
N
 
D
A
 
A
A
 
N
G
 
N
Q
|
Q
G
 
A
K
 
K
G
 
A
S
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
E
G
 
G
E
 
K
-
 
G
-
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
S
-
 
W
P
 
K
V
 
I
E
 
E
K
 
N
K
 
K
-
 
I
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
E
 
V
L
 
G
V
 
V
T
 
D
K
 
K
D
 
D
N
 
N
L
 
L
A
 
S
Q
 
E
Y
 
F

4rs3A Crystal structure of carbohydrate transporter a0qyb3 from mycobacterium smegmatis str. Mc2 155, target efi-510969, in complex with xylitol (see paper)
36% identity, 90% coverage: 25:302/309 of query aligns to 4:274/315 of 4rs3A

query
sites
4rs3A
V
 
I
S
 
G
M
 
V
A
 
T
L
 
V
F
x
Y
D
 
D
-
 
M
D
 
S
N
 
S
F
 
F
L
 
I
T
 
T
V
x
E
L
 
G
R
 
K
S
 
E
G
 
G
M
 
M
Q
 
D
E
 
T
Y
 
Y
A
 
A
K
 
K
T
 
A
L
 
-
D
 
N
G
 
N
V
 
I
E
 
E
L
 
L
Q
 
V
V
 
W
E
 
N
D
 
S
A
 
A
Q
 
N
N
 
N
D
 
D
V
 
V
A
 
S
K
 
T
Q
 
Q
Q
 
A
S
 
S
Q
 
Q
I
 
V
Q
 
D
N
 
S
F
 
L
I
 
I
A
 
N
A
 
Q
G
 
G
V
 
V
D
 
D
A
 
A
I
 
I
I
 
I
V
 
V
N
 
V
P
 
P
V
 
V
D
 
Q
T
 
A
D
 
D
A
 
S
T
 
L
A
 
G
A
 
P
M
 
Q
S
 
V
K
 
A
I
 
S
A
 
A
A
 
K
D
 
S
A
 
K
G
 
G
I
 
I
P
 
P
L
 
L
V
 
L
Y
 
A
V
 
V
N
|
N
R
 
A
E
 
A
P
 
-
V
 
-
N
 
-
V
 
L
D
 
E
T
 
T
L
 
-
P
 
P
D
 
D
K
 
L
Q
 
A
A
 
G
F
 
N
V
 
V
A
 
Q
S
 
P
N
 
D
E
 
D
Q
 
V
E
 
A
S
 
A
G
 
G
T
 
A
L
 
Q
Q
 
E
T
 
M
K
 
Q
E
 
M
I
 
M
C
 
A
K
 
D
M
 
R
L
 
L
G
 
G
G
 
G
K
 
K
G
 
G
K
 
N
A
 
I
V
 
V
V
 
I
M
 
L
M
 
Q
G
 
G
E
 
P
L
 
L
S
 
G
N
 
G
Q
 
S
A
 
G
A
 
E
R
 
I
M
 
N
R
|
R
T
 
G
K
 
K
D
 
G
I
 
I
H
 
D
D
 
Q
V
 
V
I
 
L
A
 
A
T
 
-
D
 
-
E
 
K
C
 
Y
K
 
P
G
 
D
I
 
I
E
 
K
I
 
V
V
 
L
E
 
A
E
 
K
Q
 
D
T
 
T
A
 
A
N
 
N
W
|
W
S
 
K
R
 
R
T
 
D
Q
 
E
G
 
A
S
 
V
D
 
N
L
 
K
M
 
M
T
 
K
N
 
N
W
 
W
L
 
I
S
 
S
A
 
S
-
 
F
G
 
G
L
 
P
E
 
Q
F
 
I
D
 
D
A
 
G
V
 
V
I
 
V
S
 
A
N
 
Q
N
|
N
D
 
D
E
 
D
M
 
M
A
 
G
I
 
L
G
 
G
A
 
A
I
 
L
Q
 
Q
A
 
A
L
 
L
K
 
K
A
 
E
A
 
A
G
 
G
R
 
R
S
 
T
M
 
-
D
 
-
S
 
G
V
 
V
V
 
P
I
 
I
G
 
V
G
 
G
I
 
I
D
|
D
A
 
G
T
 
I
Q
x
E
D
 
D
A
 
G
L
 
L
A
 
N
A
 
A
M
 
V
A
 
K
A
 
S
G
 
G
D
 
D
L
 
F
D
 
I
V
 
G
T
 
T
V
 
S
F
 
L
Q
|
Q
N
 
N
A
 
G
A
 
T
G
 
V
Q
 
E
G
 
L
K
 
S
G
 
A
S
 
G
V
 
L
D
 
A
A
 
V
A
 
A
L
 
D
K
 
A
L
 
L
A
 
V
K
 
K
G
 
G
E
 
E
P
 
D
V
 
V
E
 
K
K
 
T
K
 
D
V
 
P
Y
 
V
I
 
Y
P
 
V
F
 
M
E
 
P
L
 
A
V
 
I
T
 
T
K
 
K
D
 
D
N
 
N
L
 
V

8fxuA Thermoanaerobacter thermosaccharolyticum periplasmic glucose-binding protein glucose complex: badan conjugate attached at f17c (see paper)
35% identity, 91% coverage: 23:303/309 of query aligns to 6:307/310 of 8fxuA

query
sites
8fxuA
I
 
I
G
 
G
V
 
V
S
 
A
M
 
I
A
 
Y
L
 
K
F
 
F
D
 
D
D
|
D
N
 
T
F
x
C
L
 
M
T
 
T
V
 
G
L
 
V
R
 
R
S
 
N
G
 
A
M
 
M
Q
 
T
E
 
-
Y
 
-
A
 
A
K
 
E
T
 
A
L
 
Q
D
 
G
G
 
K
V
 
A
E
 
K
L
 
L
Q
 
N
V
 
M
E
 
V
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
S
V
 
Q
A
 
P
K
 
T
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
V
Q
 
D
N
 
L
F
 
F
I
 
I
A
 
T
A
 
K
G
 
K
V
 
M
D
 
N
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
P
V
 
V
D
 
D
T
 
R
D
 
T
A
 
A
T
 
A
A
 
G
A
 
T
M
 
I
S
 
I
K
 
D
I
 
K
A
 
A
A
 
K
D
 
Q
A
 
A
G
 
N
I
 
I
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
|
R
E
 
E
P
 
P
V
 
L
N
 
P
V
 
E
D
 
D
T
 
M
L
 
K
P
 
K
-
 
W
D
 
D
K
 
K
Q
 
V
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
A
N
 
K
E
 
A
Q
 
E
E
 
Q
S
 
S
G
 
G
T
 
I
L
 
L
Q
 
Q
T
 
G
K
 
Q
-
 
I
-
 
M
-
 
A
-
 
D
-
 
Y
-
 
W
-
 
K
-
 
A
-
 
H
-
 
P
E
 
E
I
 
A
C
x
D
K
 
K
M
x
N
L
 
H
G
x
D
G
 
G
K
x
V
G
 
M
K
x
Q
A
 
Y
V
 
V
V
 
M
M
 
L
M
 
M
G
 
G
E
 
Q
L
 
P
S
 
G
N
 
H
Q
 
Q
A
x
D
A
 
A
R
 
I
M
 
L
R
|
R
T
 
T
K
 
Q
D
 
-
I
 
-
H
 
-
D
 
Y
V
 
S
I
 
I
A
 
Q
T
 
T
D
 
V
E
 
K
C
 
D
K
 
A
G
 
G
I
 
I
E
 
K
I
 
V
V
 
Q
E
 
E
-
 
L
-
 
A
E
 
K
Q
 
D
T
 
Y
A
 
A
N
 
N
W
|
W
S
 
D
R
 
R
T
 
V
Q
 
T
G
 
A
S
 
H
D
 
D
L
 
K
M
 
M
T
 
A
N
 
A
W
 
W
L
 
L
S
 
S
A
 
S
-
 
F
G
 
G
L
 
D
E
 
K
F
 
I
D
x
E
A
 
A
V
 
V
I
 
F
S
 
A
N
 
N
N
|
N
D
 
D
E
 
D
M
 
M
A
 
A
I
 
L
G
 
G
A
 
A
I
 
I
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
S
A
 
A
G
 
G
R
 
Y
S
 
F
M
 
T
D
 
G
S
 
K
V
 
Y
V
 
I
-
 
P
I
 
V
G
 
V
G
 
G
I
 
V
D
|
D
A
|
A
T
|
T
Q
 
A
D
 
P
A
 
G
L
 
I
A
 
Q
A
 
A
M
 
I
A
 
K
A
 
D
G
 
G
D
 
T
L
 
L
D
 
L
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
N
 
D
A
 
A
A
 
K
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
S
 
T
V
 
F
D
 
N
A
 
I
A
 
A
L
 
Y
K
 
E
L
 
L
A
 
A
K
 
Q
G
 
G
-
 
I
E
 
T
P
 
P
V
 
T
E
 
K
-
 
D
-
 
N
-
 
I
-
 
G
-
 
Y
-
 
D
-
 
I
-
 
T
-
 
D
-
 
G
K
 
K
K
 
Y
V
 
V
Y
 
W
I
 
I
P
 
P
F
 
Y
E
 
K
L
 
K
V
 
I
T
 
T
K
 
K
D
 
D
N
 
N
L
 
I
A
 
S

8fxtA Escherichia coli periplasmic glucose-binding protein glucose complex: acrylodan conjugate attached at w183c (see paper)
35% identity, 93% coverage: 20:305/309 of query aligns to 1:305/305 of 8fxtA

query
sites
8fxtA
A
 
A
E
 
T
T
 
R
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
x
Y
L
 
K
F
 
Y
D
|
D
D
|
D
N
|
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
S
 
K
G
 
A
M
 
I
Q
 
E
E
 
Q
Y
 
D
A
 
A
K
 
K
T
 
A
L
 
A
D
 
P
G
 
D
V
 
V
E
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
|
D
A
 
S
Q
|
Q
N
|
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
A
 
K
G
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
M
 
V
S
 
I
K
 
E
I
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
G
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
 
K
E
 
E
P
 
P
V
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
T
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
I
L
 
I
Q
 
Q
T
 
G
K
x
D
E
 
L
I
 
I
C
 
A
K
|
K
M
 
H
L
 
W
G
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
-
x
D
G
 
G
K
x
Q
G
 
I
K
x
Q
A
 
F
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
|
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
-
 
T
-
 
Y
-
 
V
-
 
I
K
 
K
D
 
E
I
 
L
H
 
N
D
 
D
V
 
-
I
 
-
A
 
-
T
 
-
D
 
-
E
 
-
C
 
-
K
 
K
G
 
G
I
 
I
E
 
K
I
 
T
V
 
E
E
 
Q
E
 
L
Q
 
Q
-
 
L
-
 
D
T
 
T
A
 
A
N
x
M
W
x
C
S
x
D
R
x
T
T
 
A
Q
 
Q
G
 
A
S
x
K
D
|
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
A
 
G
-
 
P
-
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
R
 
K
S
 
S
M
 
-
D
 
-
S
 
S
V
 
I
V
 
P
I
 
V
G
 
F
G
 
G
I
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
A
 
K
A
 
S
G
 
G
D
 
A
L
 
L
D
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
N
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
S
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
D
G
 
G
E
 
K
P
 
G
V
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
N
-
 
W
-
 
K
-
 
I
-
 
D
E
 
N
K
 
K
K
 
V
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
E
 
V
L
x
G
V
 
V
T
x
D
K
 
K
D
 
D
N
|
N
L
 
L
A
 
A
Q
 
E
Y
 
F

4z0nA Crystal structure of a periplasmic solute binding protein (ipr025997) from streptobacillus moniliformis dsm-12112 (smon_0317, target efi- 511281) with bound d-galactose
34% identity, 92% coverage: 22:306/309 of query aligns to 3:306/307 of 4z0nA

query
sites
4z0nA
T
 
T
I
 
L
G
 
G
V
 
V
S
x
T
M
 
Y
A
 
Y
L
 
K
F
 
F
D
 
D
D
|
D
N
 
N
F
|
F
L
 
L
T
 
A
V
 
G
L
 
M
R
 
R
S
 
N
G
 
D
M
 
M
Q
 
I
E
 
Q
Y
 
I
A
 
A
K
 
K
-
 
E
T
 
K
L
 
Y
D
 
P
G
 
N
V
 
I
E
 
E
L
 
L
Q
 
L
V
 
N
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
S
V
x
Q
A
x
S
K
 
I
Q
 
L
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
E
N
 
V
F
 
L
I
 
I
A
 
N
A
 
K
G
 
G
V
 
V
D
 
N
A
 
V
I
 
L
I
 
V
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
T
A
 
A
T
 
G
A
 
Q
A
 
S
M
 
V
S
 
I
K
 
D
I
 
K
A
 
A
A
 
K
D
 
A
A
 
A
G
 
N
I
 
I
P
 
P
L
 
I
V
 
I
Y
x
L
V
 
F
N
|
N
R
x
K
E
 
D
P
 
P
V
 
-
N
 
G
V
|
V
D
 
D
T
 
A
L
 
L
P
 
N
-
 
S
-
 
Y
D
 
D
K
 
K
Q
 
A
A
 
W
F
x
Y
V
 
V
A
x
G
S
 
T
N
 
T
E
 
P
Q
 
K
E
 
D
S
 
S
G
 
G
T
 
I
L
 
L
Q
 
Q
T
 
G
K
 
Q
E
 
V
I
 
I
C
 
E
K
 
K
M
 
A
-
 
W
-
 
L
-
 
A
-
 
N
-
 
P
-
 
A
-
 
Y
-
x
D
L
 
L
G
x
N
G
 
G
K
x
D
G
 
G
-
x
V
-
 
I
K
x
Q
A
 
Y
V
 
V
V
 
M
M
 
L
M
 
F
G
 
G
E
 
E
L
 
P
S
 
G
N
x
Q
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
K
 
K
D
 
-
I
 
-
H
 
Y
D
 
S
V
 
I
I
 
E
A
 
Y
T
 
L
D
 
N
E
 
E
C
 
-
K
 
K
G
 
G
I
 
I
-
 
K
-
 
T
E
 
E
I
 
E
V
 
L
E
 
H
E
 
K
Q
 
D
T
 
I
A
 
A
N
 
N
W
|
W
S
 
D
R
 
A
T
 
A
Q
 
Q
G
 
A
S
 
K
D
 
D
L
 
K
M
|
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
A
 
G
-
 
P
-
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
G
M
 
M
A
 
A
I
 
L
G
 
G
A
 
A
I
 
V
Q
 
E
A
x
S
L
 
I
K
 
K
A
 
A
A
 
V
G
 
K
R
 
K
S
 
E
M
 
L
D
 
P
S
 
-
V
 
-
V
 
-
I
 
V
G
 
F
G
 
G
I
 
V
D
|
D
A
 
A
T
 
I
Q
 
Q
D
 
E
A
 
A
L
 
L
A
 
T
A
 
L
M
 
I
A
 
E
A
 
K
G
 
G
D
 
E
L
 
M
D
 
V
V
 
G
T
 
T
V
 
V
F
 
L
Q
|
Q
N
 
D
A
 
A
A
 
T
G
 
G
Q
 
Q
G
 
A
K
 
R
G
 
A
S
 
I
V
 
L
D
 
E
A
 
L
A
 
A
L
 
N
K
 
N
L
 
I
A
 
A
K
 
N
G
 
G
-
 
K
E
 
E
P
 
P
V
 
T
E
 
E
-
 
G
-
 
T
-
 
E
-
 
W
-
 
K
-
 
L
-
 
I
-
 
D
K
 
K
K
 
A
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
E
 
V
L
 
G
V
 
V
T
 
D
K
 
K
D
 
D
N
 
N
L
 
Y
A
 
K
Q
 
E
Y
 
F
Q
 
Q

5ibqA Crystal structure of an abc solute binding protein from rhizobium etli cfn 42 (rhe_pf00037,target efi-511357) in complex with alpha-d-apiose
34% identity, 93% coverage: 20:307/309 of query aligns to 2:283/287 of 5ibqA

query
sites
5ibqA
A
 
A
E
 
D
T
 
L
I
 
I
G
 
A
V
 
I
S
 
I
M
 
T
A
 
P
L
 
A
F
 
H
D
 
D
D
x
N
N
 
P
F
|
F
L
 
F
T
 
K
V
 
A
L
 
E
R
 
A
S
 
V
G
 
G
M
 
A
Q
 
E
E
 
A
Y
 
K
A
 
A
K
 
K
T
 
E
L
 
L
D
 
-
G
 
G
V
 
Y
E
 
E
L
 
T
Q
 
L
V
 
V
E
 
M
D
 
T
A
 
H
Q
 
D
N
 
D
D
 
D
V
 
A
A
 
N
K
 
K
Q
 
Q
Q
 
S
S
 
E
Q
 
M
I
 
I
Q
 
D
N
 
T
F
 
A
I
 
I
A
 
G
A
 
R
G
 
G
V
 
A
D
 
K
A
 
A
I
 
I
I
 
I
V
 
L
N
 
D
P
 
N
V
 
A
D
 
G
T
 
A
D
 
D
A
 
A
T
 
S
A
 
V
A
 
A
M
 
A
S
 
V
K
 
K
I
 
K
A
 
A
A
 
K
D
 
D
A
 
A
G
 
G
I
 
I
P
 
P
L
 
S
V
 
F
Y
 
L
V
 
I
N
x
D
R
|
R
E
 
E
P
 
-
V
 
I
N
 
N
V
 
A
D
 
T
T
 
G
L
 
V
P
 
A
D
 
V
K
 
A
Q
 
Q
A
 
-
F
 
-
V
 
I
A
 
V
S
 
S
N
 
N
E
 
N
Q
 
Y
E
 
Q
S
 
G
G
 
A
T
 
Q
L
 
L
Q
 
G
T
 
A
K
 
Q
E
 
E
I
 
F
C
 
V
K
 
K
M
 
L
L
 
M
G
 
G
G
 
E
K
 
K
G
 
G
K
 
N
A
 
Y
V
 
V
V
 
E
M
 
L
M
 
V
G
 
G
E
 
K
L
 
E
S
 
S
N
x
D
Q
 
T
A
x
N
A
 
A
R
 
G
M
 
I
R
|
R
T
 
S
K
 
Q
D
 
G
I
 
Y
H
 
H
D
|
D
V
 
V
I
 
I
A
 
-
T
 
-
D
|
D
E
x
D
C
 
Y
K
 
P
G
 
E
I
 
M
E
 
K
I
 
S
V
 
V
E
 
A
E
 
K
Q
 
Q
T
 
S
A
 
A
N
 
N
W
|
W
S
 
S
R
 
Q
T
 
T
Q
 
E
G
 
A
S
 
Y
D
 
S
L
 
K
M
 
M
T
 
E
N
 
T
W
 
I
L
 
L
S
 
Q
A
 
A
G
 
N
L
 
P
E
 
D
F
 
I
D
 
K
A
 
G
V
 
V
I
 
I
S
 
S
N
 
G
N
|
N
D
 
D
E
 
T
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
I
Q
 
A
A
 
A
L
 
L
K
 
Q
A
 
A
A
 
A
G
 
G
R
 
R
S
 
K
M
 
-
D
 
-
S
 
D
V
 
V
V
 
I
I
 
V
G
 
V
G
 
G
I
 
F
D
|
D
A
 
G
T
 
S
Q
 
N
D
 
D
A
 
V
L
 
R
A
 
D
A
 
S
M
 
I
A
 
K
A
 
S
G
 
G
D
 
G
L
 
I
D
 
K
V
 
A
T
 
T
V
 
V
F
 
L
Q
 
Q
N
 
P
A
 
A
A
 
Y
G
 
A
Q
 
Q
G
 
A
K
 
Q
G
 
L
S
 
A
V
 
V
-
 
E
-
 
Q
-
 
A
D
 
D
A
 
A
A
 
Y
L
 
I
K
 
K
L
 
-
A
 
N
K
 
K
G
 
T
E
 
T
P
 
P
V
 
K
E
 
E
K
 
E
K
 
K
V
 
Q
Y
 
L
I
 
M
P
 
D
F
 
C
E
 
V
L
 
L
V
 
I
T
 
N
K
 
A
D
 
D
N
 
N
L
 
A
A
 
G
Q
 
K
Y
 
L
Q
 
E
T
 
T

4ry0A Crystal structure of ribose transporter solute binding protein rhe_pf00037 from rhizobium etli cfn 42, target efi-511357, in complex with d-ribose
34% identity, 93% coverage: 20:307/309 of query aligns to 2:283/287 of 4ry0A

query
sites
4ry0A
A
 
A
E
 
D
T
 
L
I
 
I
G
 
A
V
 
I
S
 
I
M
 
T
A
 
P
L
 
A
F
 
H
D
 
D
D
x
N
N
 
P
F
 
F
L
x
F
T
 
K
V
 
A
L
 
E
R
 
A
S
 
V
G
 
G
M
 
A
Q
 
E
E
 
A
Y
 
K
A
 
A
K
 
K
T
 
E
L
 
L
D
 
-
G
 
G
V
 
Y
E
 
E
L
 
T
Q
 
L
V
 
V
E
 
M
D
 
T
A
 
H
Q
 
D
N
 
D
D
 
D
V
 
A
A
 
N
K
 
K
Q
 
Q
Q
 
S
S
 
E
Q
 
M
I
 
I
Q
 
D
N
 
T
F
 
A
I
 
I
A
 
G
A
 
R
G
 
G
V
 
A
D
 
K
A
 
A
I
 
I
I
 
I
V
 
L
N
 
D
P
 
N
V
 
A
D
 
G
T
 
A
D
 
D
A
 
A
T
 
S
A
 
V
A
 
A
M
 
A
S
 
V
K
 
K
I
 
K
A
 
A
A
 
K
D
 
D
A
 
A
G
 
G
I
 
I
P
 
P
L
 
S
V
 
F
Y
 
L
V
 
I
N
x
D
R
|
R
E
 
E
P
 
-
V
 
I
N
 
N
V
 
A
D
 
T
T
 
G
L
 
V
P
 
A
D
 
V
K
 
A
Q
 
Q
A
 
-
F
 
-
V
 
I
A
 
V
S
 
S
N
 
N
E
 
N
Q
 
Y
E
 
Q
S
 
G
G
 
A
T
 
Q
L
 
L
Q
 
G
T
 
A
K
 
Q
E
 
E
I
 
F
C
 
V
K
 
K
M
 
L
L
 
M
G
 
G
G
 
E
K
 
K
G
 
G
K
 
N
A
 
Y
V
 
V
V
 
E
M
 
L
M
 
V
G
 
G
E
 
K
L
 
E
S
 
S
N
x
D
Q
 
T
A
 
N
A
 
A
R
 
G
M
 
I
R
|
R
T
 
S
K
 
Q
D
 
G
I
 
Y
H
 
H
D
|
D
V
 
V
I
 
I
A
 
-
T
 
-
D
|
D
E
x
D
C
 
Y
K
 
P
G
 
E
I
 
M
E
 
K
I
 
S
V
 
V
E
 
A
E
 
K
Q
 
Q
T
 
S
A
 
A
N
 
N
W
|
W
S
 
S
R
 
Q
T
 
T
Q
 
E
G
 
A
S
 
Y
D
 
S
L
 
K
M
 
M
T
 
E
N
 
T
W
 
I
L
 
L
S
 
Q
A
 
A
G
 
N
L
 
P
E
 
D
F
 
I
D
 
K
A
 
G
V
 
V
I
 
I
S
 
S
N
 
G
N
|
N
D
 
D
E
 
T
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
I
Q
 
A
A
 
A
L
 
L
K
 
Q
A
 
A
A
 
A
G
 
G
R
 
R
S
 
K
M
 
-
D
 
-
S
 
D
V
 
V
V
 
I
I
 
V
G
 
V
G
 
G
I
 
F
D
|
D
A
 
G
T
 
S
Q
 
N
D
 
D
A
 
V
L
 
R
A
 
D
A
 
S
M
 
I
A
 
K
A
 
S
G
 
G
D
 
G
L
 
I
D
 
K
V
 
A
T
 
T
V
 
V
F
 
L
Q
|
Q
N
 
P
A
 
A
A
 
Y
G
 
A
Q
 
Q
G
 
A
K
 
Q
G
 
L
S
 
A
V
 
V
-
 
E
-
 
Q
-
 
A
D
 
D
A
 
A
A
 
Y
L
 
I
K
 
K
L
 
-
A
 
N
K
 
K
G
 
T
E
 
T
P
 
P
V
 
K
E
 
E
K
 
E
K
 
K
V
 
Q
Y
 
L
I
 
M
P
 
D
F
 
C
E
 
V
L
 
L
V
 
I
T
 
N
K
 
A
D
 
D
N
 
N
L
 
A
A
 
G
Q
 
K
Y
 
L
Q
 
E
T
 
T

Query Sequence

>SM_b20712 FitnessBrowser__Smeli:SM_b20712
MKKFFLGTAMAVLMSTAAHAETIGVSMALFDDNFLTVLRSGMQEYAKTLDGVELQVEDAQ
NDVAKQQSQIQNFIAAGVDAIIVNPVDTDATAAMSKIAADAGIPLVYVNREPVNVDTLPD
KQAFVASNEQESGTLQTKEICKMLGGKGKAVVMMGELSNQAARMRTKDIHDVIATDECKG
IEIVEEQTANWSRTQGSDLMTNWLSAGLEFDAVISNNDEMAIGAIQALKAAGRSMDSVVI
GGIDATQDALAAMAAGDLDVTVFQNAAGQGKGSVDAALKLAKGEPVEKKVYIPFELVTKD
NLAQYQTKN

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory