SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_037155072.1 NCBI__GCF_000359745.1:WP_037155072.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

4yo7A Crystal structure of an abc transporter solute binding protein (ipr025997) from bacillus halodurans c-125 (bh2323, target efi- 511484) with bound myo-inositol
43% identity, 93% coverage: 21:308/309 of query aligns to 7:286/287 of 4yo7A

query
sites
4yo7A
Q
 
K
T
 
V
I
 
I
G
 
G
V
 
V
S
 
S
M
 
I
A
 
S
L
 
N
F
 
L
D
|
D
D
 
E
N
 
-
F
 
F
L
 
L
T
 
T
V
 
Y
L
 
M
R
 
Q
N
 
D
G
 
A
M
 
M
Q
 
K
D
 
E
Y
 
E
A
 
A
K
 
A
G
 
N
M
 
Y
S
 
P
G
 
D
V
 
F
T
 
E
L
 
F
Q
 
I
V
 
F
E
 
S
D
 
D
A
 
A
Q
 
Q
N
 
N
D
 
D
V
 
S
A
 
T
K
 
Q
Q
 
Q
Q
 
M
S
 
A
Q
 
Q
I
 
V
Q
 
E
N
 
N
F
 
F
I
 
I
A
 
S
S
 
R
K
 
N
V
 
V
D
 
D
A
 
A
I
 
I
I
 
I
V
 
V
N
 
N
P
 
P
V
 
V
D
 
D
T
 
T
D
 
T
A
 
S
T
 
A
A
 
V
A
 
D
I
 
I
S
 
V
K
 
N
L
 
M
A
 
V
A
 
N
D
 
D
A
 
A
K
 
G
I
 
I
P
 
P
L
 
I
V
 
I
Y
 
I
V
 
A
N
|
N
R
|
R
E
 
-
P
 
-
A
 
-
N
 
T
V
 
F
D
 
D
S
 
G
L
 
V
P
 
D
D
 
Q
K
 
A
Q
 
T
A
 
A
F
 
F
V
 
V
A
 
G
S
 
S
N
 
E
E
 
S
Q
 
I
E
 
Q
S
 
S
G
 
G
T
 
L
L
 
L
E
 
Q
T
 
M
K
 
E
E
 
E
V
 
V
C
 
A
R
 
K
I
 
L
L
 
L
G
 
N
G
 
N
K
 
E
G
 
G
K
 
N
A
 
I
V
 
A
V
 
I
M
 
M
M
 
D
G
 
G
E
 
E
L
 
L
S
 
G
N
 
H
Q
 
E
A
 
A
A
 
Q
R
 
I
M
 
M
R
|
R
T
 
T
K
 
E
D
 
G
V
 
N
H
 
K
D
 
Q
V
 
I
L
 
I
A
 
-
T
 
-
D
 
E
G
 
E
C
 
H
K
 
D
G
 
G
I
 
L
K
 
E
I
 
V
V
 
V
Q
 
L
E
 
Q
Q
 
G
T
 
T
A
 
A
N
 
K
W
 
F
Q
 
D
R
 
R
T
 
S
Q
 
E
G
 
G
A
 
M
D
 
R
L
 
L
M
 
M
T
 
E
N
 
N
W
 
W
L
 
L
S
 
N
S
 
S
G
 
G
L
 
T
E
 
E
F
 
I
D
 
D
A
 
A
V
 
V
I
 
V
S
 
A
N
 
N
N
|
N
D
 
D
E
 
E
M
 
M
A
 
A
I
 
L
G
 
G
A
 
A
I
 
I
Q
 
L
A
 
A
L
 
L
K
 
E
A
 
A
A
 
V
G
 
G
K
 
K
P
 
-
M
x
L
D
 
D
K
 
D
I
x
V
V
 
I
V
 
V
A
 
A
G
 
G
V
 
I
D
|
D
A
 
A
T
 
T
Q
 
P
D
 
A
A
 
A
L
 
L
A
 
E
A
 
A
M
 
M
Q
 
K
A
 
E
G
 
G
D
 
K
L
 
L
K
 
D
V
 
V
T
 
T
V
 
V
F
 
F
Q
|
Q
D
 
D
A
 
A
A
 
K
G
 
G
Q
 
Q
G
 
G
K
 
A
G
 
T
A
 
S
V
 
V
D
 
K
A
 
V
A
 
A
L
 
V
K
 
Q
L
 
A
A
 
A
K
 
N
G
 
G
D
 
E
K
 
D
I
 
V
D
 
E
K
 
D
K
 
A
V
 
M
Y
 
-
I
 
I
P
 
P
F
 
Y
Q
 
E
L
 
L
V
 
V
T
 
T
P
 
P
T
 
E
N
 
N
V
 
V
K
 
E
D
 
E
F
 
Y
V
 
E
K
 
A
K
 
K

2ioyA Crystal structure of thermoanaerobacter tengcongensis ribose binding protein (see paper)
35% identity, 92% coverage: 21:303/309 of query aligns to 1:274/274 of 2ioyA

query
sites
2ioyA
Q
 
K
T
 
T
I
 
I
G
 
G
V
 
L
S
 
V
M
 
I
A
 
S
L
 
T
F
 
L
D
 
N
D
x
N
N
 
P
F
|
F
L
x
F
T
 
V
V
 
T
L
 
L
R
 
K
N
 
N
G
 
G
M
 
A
Q
 
E
D
 
E
Y
 
K
A
 
A
K
 
K
G
 
E
M
 
L
S
 
-
G
 
G
V
 
Y
T
 
K
L
 
I
Q
 
I
V
 
V
E
 
E
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
S
A
 
S
K
 
K
Q
 
E
Q
 
L
S
 
S
Q
 
N
I
 
V
Q
 
E
N
 
D
F
 
L
I
 
I
A
 
Q
S
 
Q
K
 
K
V
 
V
D
 
D
A
 
V
I
 
L
I
 
L
V
 
I
N
 
N
P
 
P
V
 
V
D
 
D
T
 
S
D
 
D
A
 
A
T
 
V
A
 
V
A
 
T
I
 
A
S
 
I
K
 
K
L
 
E
A
 
A
A
 
N
D
 
S
A
 
K
K
 
N
I
 
I
P
 
P
L
 
V
V
 
I
Y
 
T
V
 
I
N
x
D
R
|
R
E
 
S
P
 
A
A
 
N
N
 
G
V
 
G
D
 
D
S
 
V
L
 
V
P
 
-
D
 
-
K
 
-
Q
 
-
A
 
C
F
 
H
V
 
I
A
 
A
S
 
S
N
 
D
E
 
N
Q
 
V
E
 
K
S
 
G
G
 
G
T
 
E
L
 
M
E
 
A
T
 
A
K
 
E
E
 
F
V
 
I
C
 
A
R
 
K
I
 
A
L
 
L
G
 
K
G
 
G
K
 
K
G
 
G
K
 
N
A
 
V
V
 
V
V
 
E
M
 
L
M
 
E
G
 
G
E
 
I
L
 
P
S
 
G
N
 
A
Q
 
S
A
|
A
A
 
A
R
 
R
M
 
D
R
|
R
T
 
G
K
 
K
D
 
G
V
 
F
H
 
D
D
 
E
V
 
A
L
 
I
A
 
A
T
 
K
D
 
-
G
 
-
C
 
Y
K
 
P
G
 
D
I
 
I
K
 
K
I
 
I
V
 
V
Q
 
A
E
 
K
Q
 
Q
T
 
A
A
 
A
N
 
D
W
x
F
Q
 
D
R
 
R
T
 
S
Q
 
K
G
 
G
A
 
L
D
 
S
L
 
V
M
 
M
T
 
E
N
 
N
W
 
I
L
 
L
S
 
Q
S
 
A
G
 
Q
L
 
P
E
 
K
F
 
I
D
 
D
A
 
A
V
 
V
I
 
F
S
 
A
N
 
Q
N
|
N
D
 
D
E
 
E
M
 
M
A
 
A
I
 
L
G
 
G
A
 
A
I
 
I
Q
 
K
A
 
A
L
 
I
K
 
E
A
 
A
A
 
A
G
 
N
K
 
R
P
 
-
M
 
-
D
 
Q
K
 
G
I
 
I
V
 
I
V
 
V
A
 
V
G
 
G
V
 
F
D
|
D
A
 
G
T
 
T
Q
 
E
D
 
D
A
 
A
L
 
L
A
 
K
A
 
A
M
 
I
Q
 
K
A
 
E
G
 
G
D
 
K
L
 
M
K
 
A
V
 
A
T
 
T
V
 
I
F
 
A
Q
|
Q
D
 
Q
A
 
P
A
 
A
G
 
L
Q
 
M
G
 
G
K
 
S
G
 
L
A
 
G
V
 
V
D
 
E
A
 
M
A
 
A
L
 
D
K
 
K
L
 
Y
A
 
L
K
 
K
G
 
G
D
 
E
K
 
K
I
 
I
D
 
P
K
 
N
K
 
F
V
 
I
Y
 
P
I
 
A
P
 
E
F
 
L
Q
 
K
L
 
L
V
 
I
T
 
T
P
 
K
T
 
E
N
 
N
V
 
V
K
 
Q

P0AEE5 D-galactose/methyl-galactoside binding periplasmic protein MglB; D-galactose-binding periplasmic protein; GBP; D-galactose/D-glucose-binding protein; GGBP from Escherichia coli (strain K12) (see 4 papers)
36% identity, 99% coverage: 2:308/309 of query aligns to 4:332/332 of P0AEE5

query
sites
P0AEE5
K
|
K
K
x
V
F
x
L
I
x
T
L
|
L
G
x
S
S
x
A
A
x
V
M
|
M
A
|
A
-
x
S
L
x
M
L
|
L
L
x
F
S
x
G
T
x
A
A
|
A
A
|
A
H
|
H
A
|
A
-
 
A
-
 
D
Q
 
T
T
 
R
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
N
 
K
G
 
A
M
 
I
Q
 
E
D
 
Q
Y
 
D
A
 
A
K
 
K
G
 
A
M
 
A
S
 
P
G
 
D
V
 
V
T
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
S
 
K
K
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
I
 
V
S
 
I
K
 
E
L
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
K
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
 
K
E
 
E
P
 
P
A
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
S
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
I
L
 
I
E
 
Q
T
 
G
K
 
D
E
 
L
V
 
I
C
 
A
R
 
K
I
 
H
L
 
W
G
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
-
x
D
G
 
G
K
x
Q
G
 
I
K
x
Q
A
 
F
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
-
 
T
-
 
Y
-
 
V
-
 
I
K
 
K
D
 
E
V
 
L
H
 
N
D
 
D
V
 
-
L
 
-
A
 
-
T
 
-
D
 
-
G
 
-
C
 
-
K
 
K
G
 
G
I
 
I
K
 
K
I
 
T
V
 
E
Q
 
Q
E
 
L
Q
 
Q
-
 
L
-
 
D
T
 
T
A
 
A
N
 
M
W
 
W
Q
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
A
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
-
 
G
-
 
P
S
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
K
 
K
P
 
S
M
 
-
D
 
-
K
 
S
I
 
I
V
 
P
V
 
V
A
 
F
G
 
G
V
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
Q
 
K
A
 
S
G
 
G
D
 
A
L
 
L
K
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
D
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
A
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
D
G
 
G
D
 
K
-
 
G
-
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
N
-
 
W
K
 
K
I
 
I
D
 
D
K
 
N
K
 
K
-
 
V
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
Q
 
V
L
 
G
V
 
V
T
 
D
P
 
K
T
 
D
N
 
N
V
 
L
K
 
A
D
 
E
F
 
F
V
 
S
K
 
K
K
 
K

Sites not aligning to the query:

8fxuA Thermoanaerobacter thermosaccharolyticum periplasmic glucose-binding protein glucose complex: badan conjugate attached at f17c (see paper)
36% identity, 91% coverage: 23:304/309 of query aligns to 6:308/310 of 8fxuA

query
sites
8fxuA
I
 
I
G
 
G
V
 
V
S
 
A
M
 
I
A
 
Y
L
 
K
F
 
F
D
 
D
D
|
D
N
 
T
F
x
C
L
 
M
T
 
T
V
 
G
L
 
V
R
 
R
N
 
N
G
 
A
M
 
M
Q
 
T
D
 
A
Y
 
E
A
 
A
K
 
Q
G
 
G
M
 
K
S
 
A
G
 
-
V
 
-
T
 
K
L
 
L
Q
 
N
V
 
M
E
 
V
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
S
V
 
Q
A
 
P
K
 
T
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
V
Q
 
D
N
 
L
F
 
F
I
 
I
A
 
T
S
 
K
K
 
K
V
 
M
D
 
N
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
P
V
 
V
D
 
D
T
 
R
D
 
T
A
 
A
T
 
A
A
 
G
A
 
T
I
 
I
S
 
I
K
 
D
L
 
K
A
 
A
A
 
K
D
 
Q
A
 
A
K
 
N
I
 
I
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
|
R
E
 
E
P
 
P
A
 
L
N
 
P
V
 
E
D
 
D
-
 
M
S
 
K
L
 
K
P
 
W
D
 
D
K
 
K
Q
 
V
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
A
N
 
K
E
 
A
Q
 
E
E
 
Q
S
 
S
G
 
G
T
 
I
L
 
L
E
 
Q
T
 
G
K
 
Q
-
 
I
-
 
M
-
 
A
-
 
D
-
 
Y
-
 
W
-
 
K
-
 
A
-
 
H
-
 
P
E
 
E
V
 
A
C
x
D
R
 
K
I
x
N
L
 
H
G
x
D
G
 
G
K
x
V
G
 
M
K
x
Q
A
 
Y
V
 
V
V
 
M
M
 
L
M
 
M
G
 
G
E
 
Q
L
 
P
S
 
G
N
 
H
Q
 
Q
A
x
D
A
 
A
R
 
I
M
 
L
R
|
R
T
 
T
K
 
Q
D
 
Y
V
 
S
H
 
I
D
 
Q
V
 
T
L
 
V
A
 
K
T
 
D
D
 
A
G
 
G
C
 
I
K
 
K
G
 
-
I
 
V
K
 
Q
I
 
E
V
 
L
Q
 
A
E
 
K
Q
 
D
T
 
Y
A
 
A
N
 
N
W
|
W
Q
 
D
R
 
R
T
 
V
Q
 
T
G
 
A
A
 
H
D
 
D
L
 
K
M
 
M
T
 
A
N
 
A
W
 
W
L
 
L
S
 
S
S
 
S
-
 
F
G
 
G
L
 
D
E
 
K
F
 
I
D
x
E
A
 
A
V
 
V
I
 
F
S
 
A
N
 
N
N
|
N
D
 
D
E
 
D
M
 
M
A
 
A
I
 
L
G
 
G
A
 
A
I
 
I
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
S
A
 
A
G
 
G
K
 
Y
P
 
F
M
 
T
D
 
G
K
 
K
-
 
Y
I
 
I
V
 
P
V
 
V
A
 
V
G
 
G
V
 
V
D
|
D
A
|
A
T
|
T
Q
 
A
D
 
P
A
 
G
L
 
I
A
 
Q
A
 
A
M
 
I
Q
 
K
A
 
D
G
 
G
D
 
T
L
 
L
K
 
L
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
D
 
D
A
 
A
A
 
K
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
A
 
T
V
 
F
D
 
N
A
 
I
A
 
A
L
 
Y
K
 
E
L
 
L
A
 
A
K
 
Q
G
 
G
-
 
I
-
 
T
-
 
P
-
 
T
-
 
K
D
 
D
K
 
N
I
 
I
-
 
G
-
 
Y
-
 
D
-
 
I
-
 
T
-
 
D
D
 
G
K
 
K
K
 
Y
V
 
V
Y
 
W
I
 
I
P
 
P
F
 
Y
Q
 
K
L
 
K
V
 
I
T
 
T
P
 
K
T
 
D
N
 
N
V
 
I
K
 
S
D
 
D

P23905 D-galactose/methyl-galactoside binding periplasmic protein MglB; D-galactose-binding periplasmic protein; GBP; D-galactose/D-glucose-binding protein; GGBP from Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720) (see 2 papers)
34% identity, 99% coverage: 2:308/309 of query aligns to 4:332/332 of P23905

query
sites
P23905
K
 
K
K
 
V
F
 
L
I
 
T
L
 
L
G
 
S
S
 
A
A
 
V
M
 
M
A
 
A
-
 
S
L
 
L
L
 
L
L
 
F
S
 
G
T
 
A
A
 
H
A
 
A
H
 
H
A
 
A
-
 
A
-
 
D
Q
 
T
T
 
R
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
N
 
K
G
 
A
M
 
I
Q
 
E
D
 
K
Y
 
D
A
 
G
K
 
K
G
 
S
M
 
A
S
 
P
G
 
D
V
 
V
T
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
S
 
K
K
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
I
 
V
S
 
I
K
 
E
L
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
K
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
 
K
E
 
E
P
 
P
A
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
S
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
V
L
 
I
E
 
Q
T
 
G
K
 
D
E
 
L
V
 
I
C
 
A
R
 
K
I
 
H
L
 
W
-
 
Q
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
G
x
D
G
 
G
K
|
K
G
 
I
K
x
Q
A
 
Y
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
K
 
T
D
 
Y
V
 
V
H
 
V
D
 
K
V
 
E
L
 
L
A
 
N
T
 
D
D
 
K
G
 
G
C
 
I
K
 
Q
G
 
T
I
 
E
K
 
Q
I
 
L
V
 
A
Q
 
L
E
 
D
Q
 
-
T
 
T
A
 
A
N
 
M
W
 
W
Q
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
A
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
-
 
G
-
 
P
S
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
K
 
K
P
 
-
M
 
-
D
 
S
K
 
S
I
 
I
V
 
P
V
 
V
A
 
F
G
 
G
V
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
Q
 
K
A
 
S
G
 
G
D
 
A
L
 
M
K
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
D
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
A
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
E
G
 
G
D
 
K
-
 
G
-
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
S
-
 
W
K
 
K
I
 
I
D
 
E
K
 
N
K
 
K
-
 
I
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
Q
 
V
L
 
G
V
 
V
T
 
D
P
 
K
T
 
D
N
 
N
V
 
L
K
 
S
D
 
E
F
 
F
V
 
T
K
 
Q
K
 
K

2gbpA Sugar and signal-transducer binding sites of the escherichia coli galactose chemoreceptor protein (see paper)
36% identity, 93% coverage: 23:308/309 of query aligns to 5:309/309 of 2gbpA

query
sites
2gbpA
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
N
 
K
G
 
A
M
 
I
Q
 
E
D
 
Q
Y
 
D
A
 
A
K
 
K
G
 
A
M
 
A
S
 
P
G
 
D
V
 
V
T
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
S
 
K
K
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
I
 
V
S
 
I
K
 
E
L
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
K
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
x
K
E
 
E
P
 
P
A
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
S
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
I
L
 
I
E
 
Q
T
 
G
K
 
D
E
 
L
V
 
I
C
 
A
R
 
K
I
 
H
L
 
W
G
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
-
x
D
G
 
G
K
x
Q
G
 
I
K
x
Q
A
 
F
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
-
 
T
-
 
Y
-
 
V
-
 
I
K
 
K
D
 
E
V
 
L
H
 
N
D
 
D
V
 
-
L
 
-
A
 
-
T
 
-
D
 
-
G
 
-
C
 
-
K
 
K
G
 
G
I
 
I
K
 
K
I
 
T
V
 
E
Q
 
Q
E
 
L
Q
 
Q
-
 
L
-
 
D
T
 
T
A
 
A
N
 
M
W
|
W
Q
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
A
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
-
 
G
-
 
P
S
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
K
 
K
P
 
S
M
 
-
D
 
-
K
 
S
I
 
I
V
 
P
V
 
V
A
 
F
G
 
G
V
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
Q
 
K
A
 
S
G
 
G
D
 
A
L
 
L
K
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
D
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
A
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
D
G
 
G
D
 
K
-
 
G
-
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
N
-
 
W
K
 
K
I
 
I
D
 
D
K
 
N
K
 
K
-
 
V
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
Q
 
V
L
 
G
V
 
V
T
 
D
P
 
K
T
 
D
N
 
N
V
 
L
K
 
A
D
 
E
F
 
F
V
 
S
K
 
K
K
 
K

5kwsA Crystal structure of galactose binding protein from yersinia pestis in the complex with beta d glucose
35% identity, 92% coverage: 23:305/309 of query aligns to 5:306/307 of 5kwsA

query
sites
5kwsA
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
N
 
K
G
 
A
M
 
I
Q
 
E
D
 
K
Y
 
D
A
 
A
K
 
K
G
 
A
M
 
S
S
 
P
G
 
E
V
 
I
T
 
T
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
S
 
K
K
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
P
A
 
V
I
 
V
S
 
I
K
 
D
L
 
K
A
 
A
A
 
R
D
 
S
A
 
N
K
 
D
I
 
I
P
 
P
L
 
I
V
 
V
Y
 
F
V
 
Y
N
|
N
R
x
K
E
 
E
P
 
P
A
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
S
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
V
L
 
I
E
 
Q
T
 
G
K
 
E
E
 
L
V
 
I
C
 
A
R
 
K
I
 
H
L
 
W
-
 
Q
-
 
A
-
 
N
-
 
P
-
 
E
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
G
x
D
G
 
G
K
|
K
G
 
I
K
x
Q
A
 
F
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
K
 
T
D
 
Y
V
 
V
H
 
I
D
 
K
V
 
T
L
 
L
A
 
N
T
 
E
D
 
K
G
 
G
C
 
L
K
 
P
G
 
T
I
 
Q
K
 
Q
I
 
L
V
 
-
Q
 
Q
E
 
L
Q
 
D
T
 
T
A
 
A
N
 
M
W
|
W
Q
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
A
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
-
 
G
-
 
P
S
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
K
 
K
P
 
-
M
 
-
D
 
T
K
 
S
I
 
V
V
 
P
V
 
V
A
 
F
G
 
G
V
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
Q
 
K
A
 
S
G
 
G
D
 
Q
L
 
M
K
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
D
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
A
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
A
G
 
G
D
 
K
-
 
P
-
 
A
-
 
A
-
 
E
-
 
G
-
 
T
-
 
T
-
 
W
K
 
K
I
 
I
D
 
E
K
 
N
K
 
K
-
 
I
V
 
V
Y
 
R
I
 
I
P
 
P
F
 
Y
Q
 
V
L
 
G
V
 
V
T
 
D
P
 
K
T
 
D
N
 
N
V
 
L
K
 
A
D
 
E
F
 
F

7e7mC Crystal structure analysis of the streptococcus agalactiae ribose binding protein rbsb
31% identity, 92% coverage: 23:305/309 of query aligns to 11:282/284 of 7e7mC

query
sites
7e7mC
I
 
L
G
 
G
V
 
V
S
 
S
M
 
I
A
 
S
L
 
T
F
 
T
D
 
N
D
x
N
N
 
P
F
x
Y
L
x
F
T
 
V
V
 
A
L
 
M
R
 
K
N
 
D
G
 
G
M
 
I
Q
 
D
D
 
K
Y
 
Y
A
 
A
K
 
S
G
 
N
M
 
K
S
 
K
G
 
-
V
 
I
T
 
S
L
 
I
Q
 
K
V
 
V
E
 
A
D
 
D
A
 
A
Q
 
Q
N
 
D
D
 
D
V
 
A
A
 
A
K
 
R
Q
 
Q
Q
 
A
S
 
D
Q
 
D
I
 
V
Q
 
Q
N
 
N
F
 
F
I
 
I
A
 
S
S
 
Q
K
 
N
V
 
V
D
 
D
A
 
A
I
 
I
I
 
L
V
 
I
N
 
N
P
 
P
V
 
V
D
 
D
T
 
S
D
 
K
A
 
A
T
 
I
A
 
V
A
 
T
I
 
A
S
 
I
K
 
K
L
 
S
A
 
A
A
 
N
D
 
N
A
 
A
K
 
N
I
 
I
P
 
P
L
 
V
V
 
I
Y
 
L
V
 
M
N
x
D
R
|
R
E
 
G
P
 
S
A
 
E
N
 
G
V
 
G
D
 
K
S
 
V
L
 
L
P
 
-
D
 
-
K
 
-
Q
 
-
A
 
T
F
 
T
V
 
V
A
 
A
S
 
S
N
 
D
E
 
N
Q
 
V
E
 
A
S
 
A
G
 
G
T
 
K
L
 
M
E
 
A
T
 
A
K
 
D
E
 
Y
V
 
A
C
 
V
R
 
K
I
 
K
L
 
L
G
 
G
G
 
K
K
 
K
G
 
A
K
 
K
A
 
A
V
 
F
V
 
E
M
 
L
M
 
S
G
 
G
E
 
V
L
 
P
S
 
G
N
 
A
Q
 
S
A
 
A
A
 
T
R
 
V
M
 
D
R
|
R
T
 
G
K
 
K
D
 
G
V
 
F
H
 
H
D
 
S
V
 
V
L
 
A
A
 
K
T
 
S
D
 
K
G
 
-
C
 
-
K
 
-
G
 
-
I
 
L
K
 
D
I
 
M
V
 
L
Q
 
S
E
 
S
Q
 
Q
T
 
S
A
 
A
N
 
N
W
x
F
Q
 
D
R
 
R
T
 
A
Q
 
K
G
 
A
A
 
L
D
 
N
L
 
T
M
 
T
T
 
Q
N
 
N
W
 
M
L
 
I
S
 
Q
S
 
G
G
 
H
L
 
K
E
 
D
F
 
V
D
 
Q
A
 
I
V
 
I
I
 
F
S
 
A
N
 
Q
N
|
N
D
 
D
E
 
E
M
 
M
A
 
A
I
 
L
G
 
G
A
 
A
I
 
A
Q
 
Q
A
 
A
L
 
V
K
 
K
A
 
S
A
 
A
G
 
G
K
 
-
P
 
-
M
 
L
D
 
Q
K
 
N
I
 
V
V
 
L
V
 
I
A
 
V
G
 
G
V
 
I
D
|
D
A
 
G
T
 
Q
Q
 
P
D
 
D
A
 
A
L
 
H
A
 
D
A
 
A
M
 
I
Q
 
K
A
 
K
G
 
G
D
 
D
L
 
I
K
 
S
V
 
A
T
 
T
V
 
I
F
 
A
Q
|
Q
D
 
Q
A
 
P
A
 
A
G
 
K
Q
 
M
G
 
G
K
 
E
G
 
I
A
 
A
V
 
I
D
 
Q
A
 
A
A
 
A
L
 
I
K
 
D
L
 
Y
A
 
Y
K
 
K
G
 
G
D
 
K
K
 
K
I
 
V
D
 
E
K
 
K
K
 
E
V
 
T
Y
 
I
I
 
S
P
 
P
F
 
I
Q
 
Y
L
 
L
V
 
V
T
 
T
P
 
K
T
 
D
N
 
N
V
 
V
K
 
E
D
 
K
F
 
Y

2qw1A Glucose/galactose binding protein bound to 3-o-methyl d-glucose (see paper)
36% identity, 92% coverage: 23:305/309 of query aligns to 4:305/305 of 2qw1A

query
sites
2qw1A
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
 
D
N
 
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
N
 
K
G
 
A
M
 
I
Q
 
E
D
 
Q
Y
 
D
A
 
A
K
 
K
G
 
A
M
 
A
S
 
P
G
 
D
V
 
V
T
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
S
 
K
K
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
I
 
V
S
 
I
K
 
E
L
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
K
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
 
N
R
 
K
E
 
E
P
 
P
A
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
S
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
I
L
 
I
E
 
Q
T
 
G
K
 
D
E
 
L
V
 
I
C
 
A
R
 
K
I
 
H
L
 
W
G
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
-
x
D
G
 
G
K
x
Q
G
 
I
K
x
Q
A
 
F
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
 
D
A
 
A
R
 
E
M
 
A
R
 
R
T
 
T
-
 
T
-
 
Y
-
 
V
-
 
I
K
 
K
D
 
E
V
 
L
H
 
N
D
 
D
V
 
-
L
 
-
A
 
-
T
 
-
D
 
-
G
 
-
C
 
-
K
 
K
G
 
G
I
 
I
K
 
K
I
 
T
V
 
E
Q
 
Q
E
 
L
Q
 
Q
-
 
L
-
 
D
T
 
T
A
 
A
N
 
M
W
|
W
Q
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
A
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
-
 
G
-
 
P
S
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
K
 
K
P
 
S
M
 
-
D
 
-
K
 
S
I
 
I
V
 
P
V
 
V
A
 
F
G
 
G
V
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
Q
 
K
A
 
S
G
 
G
D
 
A
L
 
L
K
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
 
N
D
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
A
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
D
G
 
G
D
 
K
-
 
G
-
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
N
-
 
W
K
 
K
I
 
I
D
 
D
K
 
N
K
 
K
-
 
V
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
Q
 
V
L
 
G
V
 
V
T
 
D
P
 
K
T
 
D
N
 
N
V
 
L
K
 
A
D
 
E
F
 
F

1gcaA The 1.7 angstroms refined x-ray structure of the periplasmic glucose(slash)galactose receptor from salmonella typhimurium (see paper)
34% identity, 93% coverage: 23:308/309 of query aligns to 5:309/309 of 1gcaA

query
sites
1gcaA
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
|
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
N
 
K
G
 
A
M
 
I
Q
 
E
D
 
K
Y
 
D
A
 
G
K
 
K
G
 
S
M
 
A
S
 
P
G
 
D
V
 
V
T
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
S
 
K
K
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
I
 
V
S
 
I
K
 
E
L
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
K
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
x
K
E
 
E
P
 
P
A
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
S
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
V
L
 
I
E
 
Q
T
 
G
K
 
D
E
 
L
V
 
I
C
 
A
R
 
K
I
 
H
L
 
W
-
 
Q
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
G
x
D
G
 
G
K
|
K
G
 
I
K
x
Q
A
 
Y
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
K
 
T
D
 
Y
V
 
V
H
 
V
D
 
K
V
 
E
L
 
L
A
 
N
T
 
D
D
 
K
G
 
G
C
 
I
K
 
Q
G
 
T
I
 
E
K
 
Q
I
 
L
V
 
A
Q
 
L
E
 
D
Q
 
-
T
 
T
A
 
A
N
 
M
W
 
W
Q
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
A
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
-
 
G
-
 
P
S
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
K
 
K
P
 
-
M
 
-
D
 
S
K
 
S
I
 
I
V
 
P
V
 
V
A
 
F
G
 
G
V
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
Q
 
K
A
 
S
G
 
G
D
 
A
L
 
M
K
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
D
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
A
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
E
G
 
G
D
 
K
-
 
G
-
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
S
-
 
W
K
 
K
I
 
I
D
 
E
K
 
N
K
 
K
-
 
I
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
Q
 
V
L
 
G
V
 
V
T
 
D
P
 
K
T
 
D
N
 
N
V
 
L
K
 
S
D
 
E
F
 
F
V
 
T
K
 
Q
K
 
K

A0QYB5 D-threitol-binding protein from Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) (Mycobacterium smegmatis) (see paper)
35% identity, 97% coverage: 4:302/309 of query aligns to 8:307/349 of A0QYB5

query
sites
A0QYB5
F
 
F
I
 
A
L
 
I
G
 
A
S
 
S
A
 
A
M
 
T
A
 
A
L
 
L
L
 
G
L
 
L
S
 
G
-
 
L
-
 
T
-
 
A
-
 
C
-
 
G
-
 
A
-
 
G
-
 
D
T
 
P
A
 
A
A
 
A
H
 
N
A
 
S
Q
 
D
T
 
T
I
 
T
G
 
R
V
 
I
S
 
G
M
 
V
A
 
T
L
 
V
F
x
Y
D
 
D
-
 
M
D
 
S
N
 
S
F
 
F
L
 
I
T
 
T
V
 
A
L
 
G
R
 
K
N
 
E
G
 
G
M
 
M
Q
 
D
D
 
A
Y
 
Y
A
 
A
K
 
K
G
 
D
M
 
-
S
 
N
G
 
N
V
 
I
T
 
E
L
 
L
Q
 
I
V
 
W
E
 
N
D
 
S
A
 
A
Q
 
N
N
 
L
D
 
D
V
 
V
A
 
S
K
 
T
Q
 
Q
Q
 
A
S
 
S
Q
 
Q
I
 
V
Q
 
D
N
 
S
F
 
M
I
 
I
A
 
N
S
 
Q
K
 
G
V
 
V
D
 
D
A
 
A
I
 
I
I
 
I
V
 
V
N
 
V
P
 
P
V
 
V
D
 
Q
T
 
A
D
 
D
A
 
S
T
 
L
A
 
A
A
 
P
I
 
Q
S
 
V
K
 
A
L
 
S
A
 
A
A
 
K
D
 
A
A
 
K
K
 
G
I
 
I
P
 
P
L
 
L
V
 
V
Y
 
P
V
 
V
N
|
N
R
 
-
E
 
-
P
 
-
A
 
A
N
 
A
V
 
L
D
 
D
S
 
S
L
 
-
P
 
K
D
 
D
K
 
I
Q
 
A
A
 
G
F
 
N
V
 
V
A
 
Q
S
 
P
N
 
D
E
 
D
Q
 
V
E
 
A
S
 
A
G
 
G
T
 
A
L
 
Q
E
 
E
T
 
M
K
 
Q
E
 
M
V
 
M
C
 
A
R
 
D
I
 
R
L
 
L
G
 
G
G
 
G
K
 
K
G
 
G
K
 
N
A
 
I
V
 
V
V
 
I
M
 
L
M
 
Q
G
 
G
E
 
P
L
 
L
S
 
G
N
 
Q
Q
 
S
A
 
G
A
 
E
R
 
L
M
 
D
R
|
R
T
 
S
K
 
K
D
 
G
V
 
I
H
 
E
D
 
Q
V
 
V
L
 
L
A
 
A
T
 
K
D
 
-
G
 
-
C
 
Y
K
 
P
G
 
D
I
 
I
K
 
K
I
 
V
V
 
L
Q
 
A
E
 
K
Q
 
D
T
 
T
A
 
A
N
 
N
W
 
W
Q
 
K
R
 
R
T
 
D
Q
 
E
G
 
A
A
 
V
D
 
N
L
 
K
M
 
M
T
 
K
N
 
N
W
 
W
L
 
I
S
 
S
S
 
G
-
 
F
G
 
G
L
 
P
E
 
Q
F
 
I
D
 
D
A
 
G
V
 
V
I
 
V
S
 
A
N
 
Q
N
|
N
D
 
D
E
 
D
M
 
M
A
 
G
I
 
L
G
 
G
A
 
A
I
 
L
Q
 
Q
A
 
A
L
 
L
K
 
K
A
 
E
A
 
S
G
 
G
K
 
R
P
 
-
M
 
-
D
 
T
K
 
G
I
 
V
V
 
P
V
 
I
A
 
V
G
 
G
V
 
I
D
|
D
A
 
G
T
 
I
Q
 
E
D
 
D
A
 
G
L
 
L
A
 
N
A
 
A
M
 
V
Q
 
K
A
 
S
G
 
G
D
 
D
L
 
F
K
 
I
V
 
G
T
 
T
V
 
S
F
 
L
Q
|
Q
D
 
N
A
 
G
A
 
T
G
 
V
Q
 
E
G
 
L
K
 
A
G
 
A
A
 
G
V
 
L
D
 
A
A
 
V
A
 
A
L
 
N
K
 
R
L
 
L
A
 
A
K
 
K
G
 
G
D
 
E
K
 
P
I
 
V
D
 
N
K
 
K
K
 
E
-
 
P
V
 
V
Y
 
Y
I
 
I
P
 
-
F
 
M
Q
 
P
L
 
A
V
 
I
T
 
T
P
 
K
T
 
D
N
 
N
V
 
V

3ga5A X-ray structure of glucose/galactose receptor from salmonella typhimurium in complex with (2r)-glyceryl-beta-d-galactopyranoside (see paper)
34% identity, 92% coverage: 23:305/309 of query aligns to 3:304/305 of 3ga5A

query
sites
3ga5A
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
 
Y
L
 
K
F
 
Y
D
 
D
D
|
D
N
 
N
F
|
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
N
 
K
G
 
A
M
 
I
Q
 
E
D
 
K
Y
 
D
A
 
G
K
 
K
G
 
S
M
 
A
S
 
P
G
 
D
V
 
V
T
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
S
 
K
K
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
I
 
V
S
 
I
K
 
E
L
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
K
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
x
K
E
 
E
P
 
P
A
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
S
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
x
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
V
L
 
I
E
 
Q
T
 
G
K
 
D
E
 
L
V
 
I
C
 
A
R
 
K
I
 
H
L
 
W
-
 
Q
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
G
x
D
G
 
G
K
|
K
G
 
I
K
x
Q
A
 
Y
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
 
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
K
 
T
D
 
Y
V
 
V
H
 
V
D
 
K
V
 
E
L
 
L
A
 
N
T
 
D
D
 
K
G
 
G
C
 
I
K
 
Q
G
 
T
I
 
E
K
 
Q
I
 
L
V
 
A
Q
 
L
E
 
D
Q
 
-
T
 
T
A
 
A
N
 
M
W
|
W
Q
 
D
R
 
T
T
 
A
Q
 
Q
G
 
A
A
 
K
D
 
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
-
 
G
-
 
P
S
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
K
 
K
P
 
-
M
 
-
D
 
S
K
 
S
I
 
I
V
 
P
V
 
V
A
 
F
G
 
G
V
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
Q
 
K
A
 
S
G
 
G
D
 
A
L
 
M
K
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
D
 
D
A
 
A
A
 
N
G
 
N
Q
|
Q
G
 
A
K
 
K
G
 
A
A
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
E
G
 
G
D
 
K
-
 
G
-
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
S
-
 
W
K
 
K
I
 
I
D
 
E
K
 
N
K
 
K
-
 
I
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
Q
 
V
L
 
G
V
 
V
T
 
D
P
 
K
T
 
D
N
 
N
V
 
L
K
 
S
D
 
E
F
 
F

8fxtA Escherichia coli periplasmic glucose-binding protein glucose complex: acrylodan conjugate attached at w183c (see paper)
35% identity, 93% coverage: 20:305/309 of query aligns to 1:305/305 of 8fxtA

query
sites
8fxtA
A
 
A
Q
 
T
T
 
R
I
 
I
G
 
G
V
 
V
S
 
T
M
 
I
A
x
Y
L
 
K
F
 
Y
D
|
D
D
|
D
N
|
N
F
 
F
L
 
M
T
 
S
V
 
V
L
 
V
R
 
R
N
 
K
G
 
A
M
 
I
Q
 
E
D
 
Q
Y
 
D
A
 
A
K
 
K
G
 
A
M
 
A
S
 
P
G
 
D
V
 
V
T
 
Q
L
 
L
Q
 
L
V
 
M
E
 
N
D
|
D
A
 
S
Q
|
Q
N
|
N
D
 
D
V
 
Q
A
 
S
K
 
K
Q
 
Q
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
D
N
 
V
F
 
L
I
 
L
A
 
A
S
 
K
K
 
G
V
 
V
D
 
K
A
 
A
I
 
L
I
 
A
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
A
A
 
A
T
 
A
A
 
G
A
 
T
I
 
V
S
 
I
K
 
E
L
 
K
A
 
A
A
 
R
D
 
G
A
 
Q
K
 
N
I
 
V
P
 
P
L
 
V
V
 
V
Y
 
F
V
 
F
N
|
N
R
 
K
E
 
E
P
 
P
A
 
S
N
 
R
-
 
K
-
 
A
V
 
L
D
 
D
S
 
S
L
 
Y
P
 
-
D
 
D
K
 
K
Q
 
A
A
 
Y
F
 
Y
V
 
V
A
 
G
S
 
T
N
 
D
E
 
S
Q
 
K
E
 
E
S
 
S
G
 
G
T
 
I
L
 
I
E
 
Q
T
 
G
K
x
D
E
 
L
V
 
I
C
 
A
R
x
K
I
 
H
L
 
W
G
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
-
x
D
G
 
G
K
x
Q
G
 
I
K
x
Q
A
 
F
V
 
V
V
 
L
M
 
L
M
 
K
G
 
G
E
|
E
L
 
P
S
 
G
N
x
H
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
-
 
T
-
 
Y
-
 
V
-
 
I
K
 
K
D
 
E
V
 
L
H
 
N
D
 
D
V
 
-
L
 
-
A
 
-
T
 
-
D
 
-
G
 
-
C
 
-
K
 
K
G
 
G
I
 
I
K
 
K
I
 
T
V
 
E
Q
 
Q
E
 
L
Q
 
Q
-
 
L
-
 
D
T
 
T
A
 
A
N
x
M
W
x
C
Q
x
D
R
x
T
T
 
A
Q
 
Q
G
 
A
A
x
K
D
|
D
L
 
K
M
 
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
-
 
G
-
 
P
S
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
A
M
 
M
A
 
A
I
 
M
G
 
G
A
 
A
I
 
V
Q
 
E
A
 
A
L
 
L
K
 
K
A
 
A
A
 
H
G
 
N
K
 
K
P
 
S
M
 
-
D
 
-
K
 
S
I
 
I
V
 
P
V
 
V
A
 
F
G
 
G
V
 
V
D
|
D
A
 
A
T
 
L
Q
 
P
D
 
E
A
 
A
L
 
L
A
 
A
A
 
L
M
 
V
Q
 
K
A
 
S
G
 
G
D
 
A
L
 
L
K
 
A
V
 
G
T
 
T
V
 
V
F
 
L
Q
x
N
D
 
D
A
 
A
A
 
N
G
 
N
Q
 
Q
G
 
A
K
 
K
G
 
A
A
 
T
V
 
F
D
 
D
A
 
L
A
 
A
L
 
K
K
 
N
L
 
L
A
 
A
K
 
D
G
 
G
D
 
K
-
 
G
-
 
A
-
 
A
-
 
D
-
 
G
-
 
T
-
 
N
-
 
W
K
 
K
I
 
I
D
 
D
K
 
N
K
 
K
-
 
V
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
Q
 
V
L
x
G
V
 
V
T
x
D
P
 
K
T
 
D
N
|
N
V
 
L
K
 
A
D
 
E
F
 
F

4z0nA Crystal structure of a periplasmic solute binding protein (ipr025997) from streptobacillus moniliformis dsm-12112 (smon_0317, target efi- 511281) with bound d-galactose
34% identity, 93% coverage: 22:307/309 of query aligns to 3:307/307 of 4z0nA

query
sites
4z0nA
T
 
T
I
 
L
G
 
G
V
 
V
S
x
T
M
 
Y
A
 
Y
L
 
K
F
 
F
D
 
D
D
|
D
N
 
N
F
|
F
L
 
L
T
 
A
V
 
G
L
 
M
R
 
R
N
 
N
G
 
D
M
 
M
Q
 
I
D
 
Q
Y
 
I
A
 
A
K
 
K
-
 
E
G
 
K
M
 
Y
S
 
P
G
 
N
V
 
I
T
 
E
L
 
L
Q
 
L
V
 
N
E
 
N
D
 
D
A
 
S
Q
 
Q
N
 
N
D
 
S
V
x
Q
A
x
S
K
 
I
Q
 
L
Q
 
N
S
 
D
Q
 
Q
I
 
I
Q
 
E
N
 
V
F
 
L
I
 
I
A
 
N
S
 
K
K
 
G
V
 
V
D
 
N
A
 
V
I
 
L
I
 
V
V
 
I
N
 
N
P
 
L
V
 
V
D
 
D
T
 
P
D
 
T
A
 
A
T
 
G
A
 
Q
A
 
S
I
 
V
S
 
I
K
 
D
L
 
K
A
 
A
A
 
K
D
 
A
A
 
A
K
 
N
I
 
I
P
 
P
L
 
I
V
 
I
Y
x
L
V
 
F
N
|
N
R
x
K
E
 
D
P
 
P
A
 
G
N
 
-
V
|
V
D
 
D
S
 
A
L
 
L
P
 
N
-
 
S
-
 
Y
D
 
D
K
 
K
Q
 
A
A
 
W
F
x
Y
V
 
V
A
x
G
S
 
T
N
 
T
E
 
P
Q
 
K
E
 
D
S
 
S
G
 
G
T
 
I
L
 
L
E
 
Q
T
 
G
K
 
Q
E
 
V
V
 
I
C
 
E
R
 
K
I
 
A
-
 
W
-
 
L
-
 
A
-
 
N
-
 
P
-
 
A
-
 
Y
-
x
D
L
 
L
G
x
N
G
 
G
K
x
D
G
 
G
-
x
V
-
 
I
K
x
Q
A
 
Y
V
 
V
V
 
M
M
 
L
M
 
F
G
 
G
E
 
E
L
 
P
S
 
G
N
x
Q
Q
 
P
A
x
D
A
 
A
R
 
E
M
 
A
R
|
R
T
 
T
K
 
K
D
 
Y
V
 
S
H
 
I
D
 
E
V
 
Y
L
 
L
A
 
N
T
 
E
D
 
K
G
 
G
C
 
I
K
 
K
G
 
-
I
 
T
K
 
E
I
 
E
V
 
L
Q
 
H
E
 
K
Q
 
D
T
 
I
A
 
A
N
 
N
W
|
W
Q
 
D
R
 
A
T
 
A
Q
 
Q
G
 
A
A
 
K
D
 
D
L
 
K
M
|
M
T
 
D
N
 
A
W
 
W
L
 
L
S
 
S
-
 
G
-
 
P
S
 
N
G
 
A
L
 
N
E
 
K
F
 
I
D
x
E
A
 
V
V
 
V
I
 
I
S
 
A
N
 
N
N
|
N
D
 
D
E
 
G
M
 
M
A
 
A
I
 
L
G
 
G
A
 
A
I
 
V
Q
 
E
A
x
S
L
 
I
K
 
K
A
 
A
A
 
V
G
 
K
K
 
K
P
 
-
M
 
-
D
 
-
K
 
E
I
 
L
V
 
P
V
 
V
A
 
F
G
 
G
V
 
V
D
|
D
A
 
A
T
 
I
Q
 
Q
D
 
E
A
 
A
L
 
L
A
 
T
A
 
L
M
 
I
Q
 
E
A
 
K
G
 
G
D
 
E
L
 
M
K
 
V
V
 
G
T
 
T
V
 
V
F
 
L
Q
|
Q
D
 
D
A
 
A
A
 
T
G
 
G
Q
 
Q
G
 
A
K
 
R
G
 
A
A
 
I
V
 
L
D
 
E
A
 
L
A
 
A
L
 
N
K
 
N
L
 
I
A
 
A
K
 
N
G
 
G
D
 
K
K
 
E
-
 
P
-
 
T
-
 
E
-
 
G
-
 
T
-
 
E
-
 
W
-
 
K
-
 
L
I
 
I
D
 
D
K
 
K
K
 
A
V
 
V
Y
 
R
I
 
V
P
 
P
F
 
Y
Q
 
V
L
 
G
V
 
V
T
 
D
P
 
K
T
 
D
N
 
N
V
 
Y
K
 
K
D
 
E
F
 
F
V
 
Q
K
 
K

A0QYB3 Xylitol-binding protein from Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) (Mycobacterium smegmatis) (see paper)
34% identity, 93% coverage: 16:302/309 of query aligns to 28:307/349 of A0QYB3

query
sites
A0QYB3
T
 
T
A
 
A
A
 
A
H
 
N
A
 
S
Q
 
D
T
 
T
I
 
K
G
 
R
V
 
I
S
 
G
M
 
V
A
 
T
L
 
V
F
x
Y
D
 
D
-
 
M
D
 
S
N
 
S
F
 
F
L
 
I
T
 
T
V
 
E
L
 
G
R
 
K
N
 
E
G
 
G
M
 
M
Q
 
D
D
 
T
Y
 
Y
A
 
A
K
 
K
G
 
A
M
 
-
S
 
N
G
 
N
V
 
I
T
 
E
L