SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_086510781.1 NCBI__GCF_002151265.1:WP_086510781.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 14 hits to proteins with known functional sites (download)

5dvjA Crystal structure of galactose complexed periplasmic glucose binding protein (ppgbp) from p. Putida csv86 (see paper)
60% identity, 92% coverage: 32:418/422 of query aligns to 5:391/396 of 5dvjA

query
sites
5dvjA
V
 
V
E
 
D
V
 
V
L
 
L
H
 
H
W
|
W
W
|
W
T
 
T
S
 
S
G
 
G
G
 
G
E
|
E
A
 
A
R
 
K
A
 
A
A
 
V
N
 
E
V
 
T
L
 
L
K
 
K
E
 
Q
L
 
Q
M
 
I
E
 
Q
A
 
K
E
 
D
G
 
G
Y
 
F
G
 
I
W
 
W
E
 
K
D
 
D
F
 
N
A
 
A
V
 
V
A
 
A
G
 
G
G
|
G
G
|
G
G
 
G
E
 
A
T
 
A
A
 
A
M
 
M
T
 
T
V
 
V
L
 
L
K
 
K
S
 
T
R
 
R
A
 
A
M
 
I
S
 
S
G
 
G
N
 
N
P
 
P
P
 
P
S
 
S
A
 
A
A
 
A
Q
 
Q
I
 
I
K
|
K
G
 
G
P
 
P
E
 
D
I
 
I
Q
 
Q
E
 
E
W
 
W
G
 
G
E
 
A
L
 
L
G
 
G
L
 
L
L
 
L
G
 
T
E
 
E
L
 
L
D
 
D
E
 
D
V
 
V
A
 
A
E
 
A
A
 
A
E
 
N
G
 
K
W
 
W
D
 
D
E
 
D
L
 
L
L
 
L
P
 
P
P
 
R
T
 
Q
V
 
V
A
 
A
D
 
D
V
 
I
M
 
M
R
 
K
H
 
Y
N
 
D
G
 
G
S
 
H
Y
 
Y
V
 
V
A
 
A
V
 
V
P
 
P
V
 
V
N
 
N
V
 
I
H
 
H
R
 
R
V
 
V
N
 
N
W
 
W
L
 
L
W
 
W
A
 
I
N
 
N
P
 
P
Q
 
Q
V
 
V
L
 
F
A
 
D
A
 
K
A
 
A
G
 
G
V
 
A
E
 
K
M
 
V
P
 
P
T
 
T
T
 
T
L
 
L
D
 
D
E
 
E
L
 
L
F
 
F
A
 
A
A
 
A
G
 
A
E
 
D
A
 
K
I
 
L
R
 
K
E
 
A
A
 
A
G
 
G
Y
 
F
I
 
I
P
 
P
L
 
L
A
 
A
H
 
H
G
 
G
G
 
G
Q
 
Q
A
 
P
W
 
W
Q
 
Q
D
 
D
A
 
S
T
 
T
V
 
V
F
 
F
E
 
E
S
 
D
V
 
L
L
 
V
L
 
L
A
 
S
S
 
I
G
 
L
G
 
G
T
 
P
E
 
K
F
 
G
Y
 
Y
Q
 
H
Q
 
A
A
 
A
L
 
F
V
 
V
E
 
D
L
 
L
D
 
D
P
 
E
E
 
K
A
 
T
L
 
L
G
 
T
S
 
G
E
 
P
R
 
Q
M
 
M
I
 
T
E
 
E
A
 
A
L
 
F
E
 
A
T
 
T
F
 
L
K
 
K
R
 
R
L
 
L
R
 
G
E
 
T
L
 
Y
M
 
M
D
 
D
A
 
P
D
 
N
M
 
R
S
 
A
G
 
G
R
 
R
D
 
D
W
|
W
N
 
N
I
 
I
A
 
A
T
 
A
S
 
A
M
 
E
V
 
V
I
 
I
E
 
N
G
 
G
S
 
K
A
 
A
G
 
G
M
 
M
Q
 
Q
L
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
K
G
 
S
E
 
E
F
 
W
T
 
S
A
 
A
A
 
A
G
 
G
L
 
K
T
 
V
A
 
A
G
 
G
E
 
K
E
 
D
Y
 
Y
L
 
Q
C
 
C
A
 
V
A
 
A
A
 
F
P
 
P
G
 
G
T
 
T
Q
 
Q
D
 
G
A
 
S
F
 
F
T
 
A
F
 
Y
N
 
N
I
 
I
D
|
D
S
 
S
L
 
L
A
 
A
M
 
M
F
 
F
R
 
K
V
 
L
-
 
K
E
 
D
G
 
A
E
 
N
E
 
D
R
 
I
E
 
K
A
 
A
Q
 
Q
Q
 
N
A
 
D
L
 
L
A
 
A
R
 
K
L
 
V
V
 
A
L
 
L
E
 
E
P
 
P
T
 
E
F
 
F
Q
 
Q
E
 
T
A
 
V
F
 
F
N
 
N
L
 
Q
A
 
N
K
|
K
G
 
G
S
 
S
I
 
L
P
 
P
A
 
V
R
 
R
P
 
Q
D
 
D
L
 
M
D
 
D
M
 
M
S
 
S
G
 
K
F
 
F
D
 
D
V
 
A
C
 
C
A
 
T
Q
 
Q
Q
 
K
S
 
S
M
 
A
D
 
A
D
 
D
F
 
F
Q
 
K
R
 
E
T
 
A
A
 
A
E
 
K
E
 
G
G
 
D
G
 
G
L
 
L
V
 
Q
P
 
P
S
 
S
M
 
M
A
 
A
H
|
H
G
 
N
M
 
M
A
 
A
V
 
T
R
 
T
A
 
L
D
 
A
V
 
V
Q
 
Q
G
 
G
A
 
A
I
 
I
F
 
F
D
 
D
V
 
V
V
 
V
T
 
T
N
 
N
Y
 
F
F
 
L
N
 
N
S
 
-
R
 
-
D
 
D
M
 
P
A
 
Q
A
 
A
E
 
E
E
 
P
A
 
A
-
 
T
A
 
A
R
 
V
R
 
K
M
 
Q
V
 
L
N
 
N
A
 
A
A
 
A

5dviA High resolution crystal structure of glucose complexed periplasmic glucose binding protein (ppgbp) from p. Putida csv86 (see paper)
60% identity, 92% coverage: 32:418/422 of query aligns to 5:391/396 of 5dviA

query
sites
5dviA
V
 
V
E
 
D
V
 
V
L
 
L
H
 
H
W
|
W
W
|
W
T
 
T
S
 
S
G
 
G
G
 
G
E
|
E
A
 
A
R
 
K
A
 
A
A
 
V
N
 
E
V
 
T
L
 
L
K
 
K
E
 
Q
L
 
Q
M
 
I
E
 
Q
A
 
K
E
 
D
G
 
G
Y
 
F
G
 
I
W
 
W
E
 
K
D
 
D
F
 
N
A
 
A
V
 
V
A
 
A
G
 
G
G
 
G
G
|
G
G
 
G
E
 
A
T
 
A
A
 
A
M
 
M
T
 
T
V
 
V
L
 
L
K
 
K
S
 
T
R
 
R
A
 
A
M
 
I
S
 
S
G
 
G
N
 
N
P
 
P
P
 
P
S
 
S
A
 
A
A
 
A
Q
 
Q
I
 
I
K
|
K
G
 
G
P
 
P
E
 
D
I
 
I
Q
 
Q
E
 
E
W
 
W
G
 
G
E
 
A
L
 
L
G
 
G
L
 
L
L
 
L
G
 
T
E
 
E
L
 
L
D
 
D
E
 
D
V
 
V
A
 
A
E
 
A
A
 
A
E
 
N
G
 
K
W
 
W
D
 
D
E
 
D
L
 
L
L
 
L
P
 
P
P
 
R
T
 
Q
V
 
V
A
 
A
D
 
D
V
 
I
M
 
M
R
 
K
H
 
Y
N
 
D
G
 
G
S
 
H
Y
 
Y
V
 
V
A
 
A
V
 
V
P
 
P
V
 
V
N
 
N
V
 
I
H
 
H
R
 
R
V
 
V
N
 
N
W
 
W
L
 
L
W
 
W
A
 
I
N
 
N
P
 
P
Q
 
Q
V
 
V
L
 
F
A
 
D
A
 
K
A
 
A
G
 
G
V
 
A
E
 
K
M
 
V
P
 
P
T
 
T
T
 
T
L
 
L
D
 
D
E
 
E
L
 
L
F
 
F
A
 
A
A
 
A
G
 
A
E
 
D
A
 
K
I
 
L
R
 
K
E
 
A
A
 
A
G
 
G
Y
 
F
I
 
I
P
 
P
L
 
L
A
 
A
H
 
H
G
 
G
G
 
G
Q
 
Q
A
 
P
W
 
W
Q
 
Q
D
 
D
A
 
S
T
 
T
V
 
V
F
 
F
E
 
E
S
 
D
V
 
L
L
 
V
L
 
L
A
 
S
S
 
I
G
 
L
G
 
G
T
 
P
E
 
K
F
 
G
Y
 
Y
Q
 
H
Q
 
A
A
 
A
L
 
F
V
 
V
E
 
D
L
 
L
D
 
D
P
 
E
E
 
K
A
 
T
L
 
L
G
 
T
S
 
G
E
 
P
R
 
Q
M
 
M
I
 
T
E
 
E
A
 
A
L
 
F
E
 
A
T
 
T
F
 
L
K
 
K
R
 
R
L
 
L
R
 
G
E
 
T
L
 
Y
M
 
M
D
 
D
A
 
P
D
 
N
M
 
R
S
 
A
G
 
G
R
 
R
D
 
D
W
 
W
N
 
N
I
 
I
A
 
A
T
 
A
S
 
A
M
 
E
V
 
V
I
 
I
E
 
N
G
 
G
S
 
K
A
 
A
G
 
G
M
 
M
Q
 
Q
L
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
K
G
 
S
E
 
E
F
 
W
T
 
S
A
 
A
A
 
A
G
 
G
L
 
K
T
 
V
A
 
A
G
 
G
E
 
K
E
 
D
Y
 
Y
L
 
Q
C
 
C
A
 
V
A
 
A
A
 
F
P
 
P
G
 
G
T
 
T
Q
 
Q
D
 
G
A
 
S
F
 
F
T
 
A
F
 
Y
N
|
N
I
 
I
D
|
D
S
 
S
L
 
L
A
 
A
M
 
M
F
 
F
R
 
K
V
 
L
-
 
K
E
 
D
G
 
A
E
 
N
E
 
D
R
 
I
E
 
K
A
 
A
Q
 
Q
Q
 
N
A
 
D
L
 
L
A
 
A
R
 
K
L
 
V
V
 
A
L
 
L
E
 
E
P
 
P
T
 
E
F
 
F
Q
 
Q
E
 
T
A
 
V
F
 
F
N
 
N
L
 
Q
A
 
N
K
|
K
G
 
G
S
 
S
I
 
L
P
 
P
A
 
V
R
 
R
P
 
Q
D
 
D
L
 
M
D
 
D
M
 
M
S
 
S
G
 
K
F
 
F
D
 
D
V
 
A
C
 
C
A
 
T
Q
 
Q
Q
 
K
S
 
S
M
 
A
D
 
A
D
 
D
F
 
F
Q
 
K
R
 
E
T
 
A
A
 
A
E
 
K
E
 
G
G
 
D
G
 
G
L
 
L
V
 
Q
P
 
P
S
 
S
M
 
M
A
 
A
H
|
H
G
 
N
M
 
M
A
 
A
V
 
T
R
 
T
A
 
L
D
 
A
V
 
V
Q
 
Q
G
 
G
A
 
A
I
 
I
F
 
F
D
 
D
V
 
V
V
 
V
T
 
T
N
 
N
Y
 
F
F
 
L
N
 
N
S
 
-
R
 
-
D
 
D
M
 
P
A
 
Q
A
 
A
E
 
E
E
 
P
A
 
A
-
 
T
A
 
A
R
 
V
R
 
K
M
 
Q
V
 
L
N
 
N
A
 
A
A
 
A

4r2bA Crystal structure of sugar transporter oant_3817 from ochrobactrum anthropi, target efi-510528, with bound glucose
49% identity, 92% coverage: 32:421/422 of query aligns to 7:394/395 of 4r2bA

query
sites
4r2bA
V
 
V
E
 
E
V
 
V
L
 
L
H
 
H
W
|
W
W
 
W
T
 
T
S
 
A
G
 
G
G
 
G
E
|
E
A
 
A
R
 
A
A
 
A
A
 
L
N
 
D
V
 
V
L
 
L
K
 
K
E
 
K
L
 
D
M
 
L
E
 
E
A
 
K
E
 
K
G
 
G
Y
 
I
G
 
S
W
 
W
E
 
T
D
 
D
F
 
M
A
 
P
V
 
V
A
 
A
G
 
G
G
|
G
G
|
G
G
 
G
E
 
T
T
 
E
A
 
A
M
 
M
T
 
T
V
 
V
L
 
L
K
 
R
S
 
A
R
 
R
A
 
V
M
 
T
S
 
A
G
 
G
N
 
N
P
 
A
P
 
P
S
 
T
A
 
A
A
 
V
Q
 
Q
I
 
M
K
 
L
G
 
G
P
 
F
E
 
D
I
 
I
Q
 
R
E
 
D
W
 
W
G
 
A
E
 
E
L
 
Q
G
 
G
L
 
A
L
 
L
G
 
G
E
 
N
L
 
L
D
 
D
E
 
E
V
 
I
A
 
A
E
 
N
A
 
K
E
 
E
G
 
G
W
 
W
D
 
E
E
 
K
L
 
V
L
 
I
P
 
P
P
 
A
T
 
P
V
 
L
A
 
Q
D
 
E
V
 
F
M
 
A
R
 
K
H
 
Y
N
 
D
G
 
G
S
 
H
Y
 
W
V
 
I
A
 
A
V
 
A
P
 
P
V
 
V
N
 
N
V
 
V
H
|
H
R
 
S
V
 
T
N
 
N
W
 
W
L
 
M
W
 
W
A
 
I
N
 
N
P
 
K
Q
 
A
V
 
A
L
 
L
A
 
D
A
 
K
A
 
A
G
 
G
V
 
G
E
 
K
M
 
E
P
 
P
T
 
T
T
 
N
L
 
W
D
 
D
E
 
E
L
 
L
F
 
I
A
 
A
A
 
L
G
 
L
E
 
D
A
 
K
I
 
F
R
 
K
E
 
E
A
 
Q
G
 
G
Y
 
I
I
 
T
P
 
P
L
 
I
A
 
A
H
 
H
G
 
G
G
 
G
Q
 
Q
A
 
P
W
 
W
Q
 
Q
D
 
D
A
 
A
T
 
T
V
 
I
F
 
F
E
 
D
S
 
A
V
 
V
L
 
V
L
 
L
A
 
-
S
 
S
G
 
F
G
 
G
T
 
T
E
 
D
F
 
F
Y
 
Y
Q
 
K
Q
 
K
A
 
A
L
 
F
V
 
I
E
 
D
L
 
L
D
 
D
P
 
P
E
 
E
A
 
T
L
 
L
G
 
G
S
 
S
E
 
D
R
 
T
M
 
M
I
 
K
E
 
Q
A
 
A
L
 
F
E
 
D
T
 
R
F
 
M
K
 
T
R
 
K
L
 
L
R
 
R
E
 
S
L
 
Y
M
 
V
D
 
D
A
 
D
D
 
N
M
 
F
S
 
S
G
 
G
R
 
R
D
 
D
W
|
W
N
 
N
I
 
L
A
 
A
T
 
S
S
 
A
M
 
M
V
 
V
I
 
I
E
 
E
G
 
G
S
 
K
A
 
A
G
 
G
M
 
L
Q
 
Q
L
 
F
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
K
G
 
G
E
 
E
F
 
F
T
 
V
A
 
K
A
 
A
G
 
G
L
 
K
T
 
K
A
 
P
G
 
G
E
 
E
E
 
D
Y
 
F
L
 
V
C
 
C
A
 
M
A
 
R
A
 
Y
P
 
P
G
 
G
T
 
T
Q
 
Q
D
 
G
A
 
A
F
 
I
T
 
T
F
 
F
N
 
N
I
 
S
D
|
D
S
 
M
L
 
F
A
 
A
M
 
M
F
 
F
R
 
K
V
 
V
E
 
S
G
 
E
E
 
D
E
 
K
R
 
V
E
 
P
A
 
A
Q
 
Q
Q
 
L
A
 
E
L
 
M
A
 
A
R
 
S
L
 
A
V
 
I
L
 
E
E
 
S
P
 
P
T
 
T
F
 
F
Q
 
Q
E
 
S
A
 
A
F
 
F
N
 
N
L
 
V
A
 
V
K
|
K
G
 
G
S
 
S
I
 
A
P
 
P
A
 
A
R
 
R
P
 
T
D
 
D
L
 
V
D
 
P
M
 
D
S
 
T
G
 
D
F
 
F
D
 
D
V
 
A
C
 
C
A
 
G
Q
 
K
Q
 
K
S
 
A
M
 
I
D
 
A
D
 
D
F
 
E
Q
 
K
R
 
E
T
 
A
A
 
S
E
 
E
E
 
K
G
 
G
G
 
T
L
 
M
V
 
L
P
 
G
S
 
S
M
 
M
A
 
A
H
|
H
G
 
G
M
 
Y
A
 
A
V
 
N
R
 
P
A
 
A
D
 
A
V
 
V
Q
 
K
G
 
N
A
 
A
I
 
I
F
 
Y
D
 
D
V
 
V
V
 
V
T
 
T
N
 
R
Y
 
Q
F
 
F
N
 
N
S
 
G
R
 
Q
D
 
-
M
 
L
A
 
S
A
 
S
E
 
E
E
 
D
A
 
A
A
 
V
R
 
K
R
 
E
M
 
L
V
 
V
N
 
S
A
 
A
A
 
V
Q
 
E
A
 
G
A
 
A

8hqqA Crystal structure of the glucose-binding protein sar11_0769 from "candidatus pelagibacter ubique" htcc1062 bound to glucose
48% identity, 89% coverage: 29:403/422 of query aligns to 2:380/398 of 8hqqA

query
sites
8hqqA
A
 
A
A
 
P
E
 
K
V
 
A
E
 
E
V
 
V
L
 
L
H
 
H
W
|
W
W
 
W
T
 
T
S
 
G
G
 
G
G
 
G
E
|
E
A
 
A
R
 
K
A
 
A
A
 
L
N
 
K
V
 
V
L
 
L
K
 
Q
E
 
D
L
 
E
M
 
F
E
 
A
A
 
A
E
 
Q
G
 
N
Y
 
G
G
 
V
W
 
W
E
 
L
D
 
D
F
 
M
A
 
P
V
 
V
A
 
S
G
 
G
G
 
G
G
|
G
G
 
G
E
 
D
T
 
A
A
 
A
M
 
M
T
 
Q
V
 
T
L
 
L
K
 
K
S
 
A
R
 
R
A
 
I
M
 
V
S
 
A
G
 
N
N
 
D
P
 
A
P
 
P
S
 
A
A
 
A
A
 
A
Q
 
Q
I
 
I
K
|
K
G
 
G
P
 
P
E
 
T
I
 
I
Q
 
Q
E
 
E
W
 
Y
G
 
D
E
 
E
L
 
E
G
 
G
L
 
V
L
 
V
G
 
A
-
 
P
-
 
Y
E
 
N
L
 
I
D
 
D
E
 
A
V
 
V
A
 
A
E
 
K
A
 
K
E
 
E
G
 
G
W
 
W
D
 
D
E
 
N
L
 
L
L
 
L
P
 
S
P
 
K
T
 
Q
V
 
V
A
 
A
D
 
S
V
 
H
M
 
M
R
 
K
H
 
C
N
 
D
-
 
D
-
 
G
G
 
K
S
 
A
Y
 
Y
V
 
C
A
 
A
V
 
A
P
 
P
V
 
V
N
 
N
V
 
I
H
|
H
R
 
R
V
 
I
N
 
D
W
 
W
L
 
I
W
 
W
A
 
A
N
 
N
P
 
K
Q
 
K
V
 
V
L
 
L
A
 
D
A
 
S
A
 
N
G
 
G
V
 
I
E
 
K
M
 
M
P
 
P
T
 
S
T
 
T
L
 
W
D
 
A
E
 
E
L
 
F
F
 
N
A
 
A
A
 
A
G
 
A
E
 
D
A
 
K
I
 
L
R
 
Q
E
 
A
A
 
N
G
 
G
Y
 
I
I
 
I
P
 
P
L
 
L
A
 
A
H
 
H
G
 
G
G
 
S
Q
 
Q
A
 
P
W
 
W
Q
 
Q
D
 
D
A
 
A
T
 
T
V
 
V
F
 
F
E
 
E
S
 
A
V
 
V
L
 
A
L
 
L
A
 
G
S
 
V
G
 
G
G
 
G
T
 
N
E
 
D
F
 
F
Y
 
Y
Q
 
R
Q
 
K
A
 
A
L
 
F
V
 
V
E
 
D
L
 
L
D
 
D
P
 
A
E
 
A
A
 
T
L
 
L
G
 
G
S
 
G
E
 
S
R
 
T
M
 
M
I
 
T
E
 
K
A
 
V
L
 
F
E
 
D
T
 
Q
F
 
M
K
 
R
R
 
K
L
 
L
R
 
K
E
 
G
L
 
Y
M
 
T
D
 
D
A
 
A
D
 
G
M
 
S
S
 
P
G
 
G
R
 
R
D
 
D
W
 
W
N
 
N
I
 
V
A
 
A
T
 
T
S
 
G
M
 
M
V
 
V
I
 
M
E
 
E
G
 
G
S
 
K
A
 
A
G
 
A
M
 
F
Q
 
Q
L
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
K
G
 
G
E
 
E
F
 
F
T
 
A
A
 
A
A
 
N
G
 
N
L
 
M
T
 
A
A
 
P
G
 
G
E
 
K
E
 
D
Y
 
Y
L
 
I
C
 
C
A
 
A
A
 
P
A
 
T
P
 
P
G
 
-
T
 
S
Q
 
N
D
 
N
A
 
G
F
 
Y
T
 
L
F
 
Y
N
 
N
I
 
V
D
|
D
S
 
S
L
 
F
A
 
I
M
 
F
F
 
Y
R
 
K
V
 
V
E
 
K
G
 
G
E
 
K
E
 
D
R
 
K
-
 
V
E
 
E
A
 
G
Q
 
Q
Q
 
K
A
 
L
L
 
L
A
 
A
R
 
S
L
 
L
V
 
M
L
 
M
E
 
G
P
 
K
T
 
N
F
 
F
Q
 
Q
E
 
K
A
 
V
F
 
F
N
 
N
L
 
I
A
 
Y
K
|
K
G
 
G
S
 
S
I
 
I
P
 
P
A
 
A
R
 
R
P
 
L
D
 
D
L
 
V
D
 
S
M
 
M
S
 
D
G
 
E
F
 
F
D
 
D
V
 
M
C
 
C
A
 
A
Q
 
K
Q
 
K
S
 
S
M
 
N
D
 
A
D
 
D
F
 
L
Q
 
K
R
 
T
T
 
A
A
 
G
E
 
S
E
 
K
G
 
G
G
 
G
L
 
L
V
 
L
P
 
P
S
 
S
M
 
F
A
 
A
H
|
H
G
 
G
M
 
M
A
 
A
V
 
L
R
 
R
A
 
L
D
 
A
V
 
Q
Q
 
K
G
 
G
A
 
A
I
 
I
F
 
Q
D
 
D
V
 
V
V
 
V
T
 
T
N
 
E
Y
 
H
F
 
F
N
 
N
S
 
S
R
 
N

2b3fA Thermus thermophilus glucose/galactose binding protein bound with galactose (see paper)
31% identity, 89% coverage: 31:404/422 of query aligns to 2:372/392 of 2b3fA

query
sites
2b3fA
E
 
K
V
 
L
E
 
E
V
 
I
L
 
F
H
 
S
W
|
W
W
|
W
T
 
-
S
 
A
G
 
G
G
 
D
E
|
E
A
 
G
R
 
P
A
 
A
A
 
L
N
 
E
V
 
A
L
 
L
K
 
I
E
 
R
L
 
L
M
 
Y
E
 
K
A
 
Q
E
 
K
G
 
Y
Y
 
P
G
 
G
W
 
V
E
 
E
-
 
V
-
 
I
D
 
N
F
 
A
A
 
T
V
 
V
A
 
T
G
 
G
G
|
G
G
x
A
G
 
G
E
 
V
T
 
N
A
 
A
M
 
R
T
 
A
V
 
V
L
 
L
K
 
K
S
 
T
R
 
R
A
 
M
M
 
L
S
 
G
G
 
G
N
 
D
P
 
P
P
 
P
S
 
D
A
 
T
A
 
F
Q
 
Q
I
 
V
K
x
H
-
 
A
G
 
G
P
 
M
E
 
E
-
 
L
I
 
I
Q
 
G
E
 
T
W
 
W
G
 
V
E
 
V
L
 
A
G
 
N
L
 
R
L
 
M
G
 
E
E
 
D
L
 
L
D
 
S
E
 
A
V
 
L
A
 
F
E
 
R
A
 
Q
E
 
E
G
 
G
W
 
W
D
 
L
E
 
Q
L
 
A
L
 
F
P
 
P
P
 
K
T
 
G
V
 
L
A
 
I
D
 
D
V
 
L
M
 
I
R
 
S
H
 
Y
N
 
K
G
 
G
S
 
G
Y
 
I
V
 
W
A
 
S
V
 
V
P
 
P
V
 
V
N
 
N
V
 
I
H
 
H
R
 
R
V
 
S
N
 
N
W
 
V
L
 
M
W
 
W
A
 
Y
N
 
L
P
 
P
Q
 
A
V
 
K
L
 
L
A
 
K
A
 
G
A
 
W
G
 
G
V
 
V
E
 
N
M
 
P
P
 
P
T
 
R
T
 
T
L
 
W
D
 
D
E
 
K
L
 
F
F
 
L
A
 
A
A
 
T
G
 
C
E
 
Q
A
 
T
I
 
L
R
 
K
E
 
Q
A
 
K
G
 
G
Y
 
L
-
 
E
I
 
A
P
 
P
L
 
L
A
 
A
H
 
L
G
 
-
G
 
G
Q
 
E
A
 
N
W
 
W
Q
 
T
D
 
Q
A
 
Q
T
 
H
V
 
L
F
 
W
E
 
E
S
 
S
V
 
V
L
 
A
L
 
L
A
 
A
S
 
V
G
 
L
G
 
G
T
 
P
E
 
D
-
 
D
-
 
W
-
 
N
-
 
N
F
 
L
Y
 
W
Q
 
N
Q
 
G
A
 
K
L
 
L
V
 
K
E
 
F
L
 
T
D
 
D
P
 
P
E
 
K
A
 
A
L
 
-
G
 
-
S
 
-
E
 
-
R
 
-
M
 
-
I
 
V
E
 
R
A
 
A
L
 
W
E
 
E
T
 
V
F
 
F
K
 
G
R
 
R
L
 
V
R
 
L
E
 
D
L
 
C
M
 
A
D
 
N
A
 
K
D
 
D
M
 
A
S
 
A
G
 
G
R
 
L
D
 
S
W
 
W
N
 
Q
I
 
Q
A
 
A
T
 
V
S
 
D
M
 
R
V
 
V
I
 
V
E
 
Q
G
 
G
S
 
K
A
 
A
G
 
A
M
 
F
Q
 
N
L
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
A
G
 
G
E
 
Y
F
 
M
T
 
T
A
 
T
A
 
T
-
 
L
G
 
K
L
 
L
T
 
K
A
 
P
G
 
G
E
 
T
E
 
D
Y
 
F
L
 
A
C
 
W
A
 
A
A
 
P
A
 
S
P
 
P
G
 
G
T
 
T
Q
 
Q
D
 
G
A
 
V
F
 
F
T
 
M
F
 
M
N
 
L
I
 
S
D
|
D
S
 
S
L
 
F
A
 
G
M
 
L
F
 
P
R
 
K
V
 
G
E
 
A
G
 
K
E
 
N
E
 
R
R
 
Q
E
 
N
A
 
A
Q
 
I
Q
 
N
A
 
W
L
 
L
A
 
-
R
 
R
L
 
L
V
 
V
L
 
G
E
 
S
P
 
K
T
 
E
F
 
G
Q
 
Q
E
 
D
A
 
T
F
 
S
N
 
N
L
 
P
A
 
L
K
|
K
G
 
G
S
 
S
I
 
I
P
 
A
A
 
A
R
 
R
P
 
L
D
 
D
L
 
S
D
 
D
M
 
P
S
 
S
G
 
K
F
 
Y
D
 
N
V
 
A
C
 
Y
A
 
G
Q
 
Q
Q
 
S
S
 
A
M
 
M
D
 
R
D
 
D
F
 
W
Q
 
R
R
 
S
T
 
N
A
 
R
E
 
-
E
 
-
G
 
-
G
 
-
L
 
I
V
 
V
P
 
G
S
 
S
M
 
L
A
 
V
H
|
H
G
 
G
M
 
A
A
 
V
V
 
A
R
 
P
A
 
E
D
 
S
V
 
F
Q
 
M
G
 
S
A
 
Q
I
 
F
F
 
G
D
 
T
V
 
V
V
 
M
T
 
E
N
 
I
Y
 
F
F
 
L
N
 
Q
S
 
T
R
 
R
D
 
N

2b3bC Thermus thermophilus glucose/galactose binding protein with bound glucose (see paper)
31% identity, 89% coverage: 31:404/422 of query aligns to 2:372/392 of 2b3bC

query
sites
2b3bC
E
 
K
V
 
L
E
 
E
V
 
I
L
 
F
H
 
S
W
|
W
W
 
W
T
 
-
S
 
A
G
 
G
G
 
D
E
|
E
A
 
G
R
 
P
A
 
A
A
 
L
N
 
E
V
 
A
L
 
L
K
 
I
E
 
R
L
 
L
M
 
Y
E
 
K
A
 
Q
E
 
K
G
 
Y
Y
 
P
G
 
G
W
 
V
E
 
E
-
 
V
-
 
I
D
 
N
F
 
A
A
 
T
V
 
V
A
 
T
G
 
G
G
 
G
G
x
A
G
 
G
E
 
V
T
 
N
A
 
A
M
 
R
T
 
A
V
 
V
L
 
L
K
 
K
S
 
T
R
 
R
A
 
M
M
 
L
S
 
G
G
 
G
N
 
D
P
 
P
P
 
P
S
 
D
A
 
T
A
 
F
Q
 
Q
I
 
V
K
x
H
-
 
A
G
 
G
P
 
M
E
 
E
-
 
L
I
 
I
Q
 
G
E
 
T
W
 
W
G
 
V
E
 
V
L
 
A
G
 
N
L
 
R
L
 
M
G
 
E
E
 
D
L
 
L
D
 
S
E
 
A
V
 
L
A
 
F
E
 
R
A
 
Q
E
 
E
G
 
G
W
 
W
D
 
L
E
 
Q
L
 
A
L
 
F
P
 
P
P
 
K
T
 
G
V
 
L
A
 
I
D
 
D
V
 
L
M
 
I
R
 
S
H
 
Y
N
 
K
G
 
G
S
 
G
Y
 
I
V
 
W
A
 
S
V
 
V
P
 
P
V
 
V
N
 
N
V
 
I
H
 
H
R
 
R
V
 
S
N
 
N
W
 
V
L
 
M
W
 
W
A
 
Y
N
 
L
P
 
P
Q
 
A
V
 
K
L
 
L
A
 
K
A
 
G
A
 
W
G
 
G
V
 
V
E
 
N
M
 
P
P
 
P
T
 
R
T
 
T
L
 
W
D
 
D
E
 
K
L
 
F
F
 
L
A
 
A
A
 
T
G
 
C
E
 
Q
A
 
T
I
 
L
R
 
K
E
 
Q
A
 
K
G
 
G
Y
 
L
-
 
E
I
 
A
P
 
P
L
 
L
A
 
A
H
 
L
G
 
-
G
 
G
Q
 
E
A
 
N
W
 
W
Q
 
T
D
 
Q
A
 
Q
T
 
H
V
 
L
F
 
W
E
 
E
S
 
S
V
 
V
L
 
A
L
 
L
A
 
A
S
 
V
G
 
L
G
 
G
T
 
P
E
 
D
-
 
D
-
 
W
-
 
N
-
 
N
F
 
L
Y
 
W
Q
 
N
Q
 
G
A
 
K
L
 
L
V
 
K
E
 
F
L
 
T
D
 
D
P
 
P
E
 
K
A
 
A
L
 
-
G
 
-
S
 
-
E
 
-
R
 
-
M
 
-
I
 
V
E
 
R
A
 
A
L
 
W
E
 
E
T
 
V
F
 
F
K
 
G
R
 
R
L
 
V
R
 
L
E
 
D
L
 
C
M
 
A
D
 
N
A
 
K
D
 
D
M
 
A
S
 
A
G
 
G
R
 
L
D
 
S
W
 
W
N
 
Q
I
 
Q
A
 
A
T
 
V
S
 
D
M
 
R
V
 
V
I
 
V
E
 
Q
G
 
G
S
 
K
A
 
A
G
 
A
M
 
F
Q
 
N
L
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
A
G
 
G
E
 
Y
F
 
M
T
 
T
A
 
T
A
 
T
-
 
L
G
 
K
L
 
L
T
 
K
A
 
P
G
 
G
E
 
T
E
 
D
Y
 
F
L
 
A
C
 
W
A
 
A
A
 
P
A
 
S
P
 
P
G
 
G
T
 
T
Q
 
Q
D
 
G
A
 
V
F
 
F
T
 
M
F
 
M
N
 
L
I
 
S
D
|
D
S
 
S
L
 
F
A
 
G
M
 
L
F
 
P
R
 
K
V
 
G
E
 
A
G
 
K
E
 
N
E
 
R
R
 
Q
E
 
N
A
 
A
Q
 
I
Q
 
N
A
 
W
L
 
L
A
 
-
R
 
R
L
 
L
V
 
V
L
 
G
E
 
S
P
 
K
T
 
E
F
 
G
Q
 
Q
E
 
D
A
 
T
F
 
S
N
 
N
L
 
P
A
 
L
K
|
K
G
 
G
S
 
S
I
 
I
P
 
A
A
 
A
R
 
R
P
 
L
D
 
D
L
 
S
D
 
D
M
 
P
S
 
S
G
 
K
F
 
Y
D
 
N
V
 
A
C
 
Y
A
 
G
Q
 
Q
Q
 
S
S
 
A
M
 
M
D
 
R
D
 
D
F
 
W
Q
 
R
R
 
S
T
 
N
A
 
R
E
 
-
E
 
-
G
 
-
G
 
-
L
 
I
V
 
V
P
 
G
S
 
S
M
 
L
A
 
V
H
|
H
G
 
G
M
 
A
A
 
V
V
 
A
R
 
P
A
 
E
D
 
S
V
 
F
Q
 
M
G
 
S
A
 
Q
I
 
F
F
 
G
D
 
T
V
 
V
V
 
M
T
 
E
N
 
I
Y
 
F
F
 
L
N
 
Q
S
 
T
R
 
R
D
 
N

2b3bA Thermus thermophilus glucose/galactose binding protein with bound glucose (see paper)
31% identity, 89% coverage: 31:404/422 of query aligns to 2:372/392 of 2b3bA

query
sites
2b3bA
E
 
K
V
 
L
E
 
E
V
 
I
L
 
F
H
 
S
W
|
W
W
|
W
T
 
-
S
 
A
G
 
G
G
 
D
E
|
E
A
 
G
R
 
P
A
 
A
A
 
L
N
 
E
V
 
A
L
 
L
K
 
I
E
 
R
L
 
L
M
 
Y
E
 
K
A
 
Q
E
 
K
G
 
Y
Y
 
P
G
 
G
W
 
V
E
 
E
-
 
V
-
 
I
D
 
N
F
 
A
A
 
T
V
 
V
A
 
T
G
 
G
G
 
G
G
x
A
G
 
G
E
 
V
T
 
N
A
 
A
M
 
R
T
 
A
V
 
V
L
 
L
K
 
K
S
 
T
R
 
R
A
 
M
M
 
L
S
 
G
G
 
G
N
 
D
P
 
P
P
 
P
S
 
D
A
 
T
A
 
F
Q
 
Q
I
 
V
K
x
H
-
 
A
G
 
G
P
 
M
E
 
E
-
 
L
I
 
I
Q
 
G
E
 
T
W
 
W
G
 
V
E
 
V
L
 
A
G
 
N
L
 
R
L
 
M
G
 
E
E
 
D
L
 
L
D
 
S
E
 
A
V
 
L
A
 
F
E
 
R
A
 
Q
E
 
E
G
 
G
W
 
W
D
 
L
E
 
Q
L
 
A
L
 
F
P
 
P
P
 
K
T
 
G
V
 
L
A
 
I
D
 
D
V
 
L
M
 
I
R
 
S
H
 
Y
N
 
K
G
 
G
S
 
G
Y
 
I
V
 
W
A
 
S
V
 
V
P
 
P
V
 
V
N
 
N
V
 
I
H
 
H
R
 
R
V
 
S
N
 
N
W
 
V
L
 
M
W
 
W
A
 
Y
N
 
L
P
 
P
Q
 
A
V
 
K
L
 
L
A
 
K
A
 
G
A
 
W
G
 
G
V
 
V
E
 
N
M
 
P
P
 
P
T
 
R
T
 
T
L
 
W
D
 
D
E
 
K
L
 
F
F
 
L
A
 
A
A
 
T
G
 
C
E
 
Q
A
 
T
I
 
L
R
 
K
E
 
Q
A
 
K
G
 
G
Y
 
L
-
 
E
I
 
A
P
 
P
L
 
L
A
 
A
H
 
L
G
 
-
G
 
G
Q
 
E
A
 
N
W
 
W
Q
 
T
D
 
Q
A
 
Q
T
 
H
V
 
L
F
 
W
E
 
E
S
 
S
V
 
V
L
 
A
L
 
L
A
 
A
S
 
V
G
 
L
G
 
G
T
 
P
E
 
D
-
 
D
-
 
W
-
 
N
-
 
N
F
 
L
Y
 
W
Q
 
N
Q
 
G
A
 
K
L
 
L
V
 
K
E
 
F
L
 
T
D
 
D
P
 
P
E
 
K
A
 
A
L
 
-
G
 
-
S
 
-
E
 
-
R
 
-
M
 
-
I
 
V
E
 
R
A
 
A
L
 
W
E
 
E
T
 
V
F
 
F
K
 
G
R
 
R
L
 
V
R
 
L
E
 
D
L
 
C
M
 
A
D
 
N
A
 
K
D
 
D
M
 
A
S
 
A
G
 
G
R
 
L
D
 
S
W
 
W
N
 
Q
I
 
Q
A
 
A
T
 
V
S
 
D
M
 
R
V
 
V
I
 
V
E
 
Q
G
 
G
S
 
K
A
 
A
G
 
A
M
 
F
Q
 
N
L
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
A
G
 
G
E
 
Y
F
 
M
T
 
T
A
 
T
A
 
T
-
 
L
G
 
K
L
 
L
T
 
K
A
 
P
G
 
G
E
 
T
E
 
D
Y
 
F
L
 
A
C
 
W
A
 
A
A
 
P
A
 
S
P
 
P
G
 
G
T
 
T
Q
 
Q
D
 
G
A
 
V
F
 
F
T
 
M
F
 
M
N
 
L
I
 
S
D
|
D
S
 
S
L
 
F
A
 
G
M
 
L
F
 
P
R
 
K
V
 
G
E
 
A
G
 
K
E
 
N
E
 
R
R
 
Q
E
 
N
A
 
A
Q
 
I
Q
 
N
A
 
W
L
 
L
A
 
-
R
 
R
L
 
L
V
 
V
L
 
G
E
 
S
P
 
K
T
 
E
F
 
G
Q
 
Q
E
 
D
A
 
T
F
 
S
N
 
N
L
 
P
A
 
L
K
|
K
G
 
G
S
 
S
I
 
I
P
 
A
A
 
A
R
 
R
P
 
L
D
 
D
L
 
S
D
 
D
M
 
P
S
 
S
G
 
K
F
 
Y
D
 
N
V
 
A
C
 
Y
A
 
G
Q
 
Q
Q
 
S
S
 
A
M
 
M
D
 
R
D
 
D
F
 
W
Q
 
R
R
 
S
T
 
N
A
 
R
E
 
-
E
 
-
G
 
-
G
 
-
L
 
I
V
 
V
P
 
G
S
 
S
M
 
L
A
 
V
H
|
H
G
 
G
M
 
A
A
 
V
V
 
A
R
 
P
A
 
E
D
 
S
V
 
F
Q
 
M
G
 
S
A
 
Q
I
 
F
F
 
G
D
 
T
V
 
V
V
 
M
T
 
E
N
 
I
Y
 
F
F
 
L
N
 
Q
S
 
T
R
 
R
D
 
N

3vxcA Crystal structure of xylobiose-bxle complex from streptomyces thermoviolaceus opc-520
27% identity, 42% coverage: 95:272/422 of query aligns to 67:249/398 of 3vxcA

query
sites
3vxcA
G
 
G
P
 
G
E
 
S
I
 
I
Q
 
K
E
 
A
W
 
Y
G
 
K
E
 
E
L
 
A
G
 
G
L
 
Q
L
 
L
G
 
V
E
 
D
L
 
L
D
 
T
E
 
D
V
 
V
A
 
I
E
 
K
A
 
S
E
 
-
G
 
-
W
 
-
D
 
D
E
 
E
L
 
V
L
 
L
P
 
S
-
 
T
-
 
G
-
 
F
-
 
L
P
 
P
T
 
S
V
 
V
A
 
V
D
 
A
V
 
A
M
 
G
R
 
S
H
 
L
N
 
D
G
 
G
S
 
H
Y
 
E
V
 
Y
A
 
G
V
 
I
P
 
P
V
 
M
N
x
R
V
 
G
H
 
M
R
x
Q
V
 
P
N
 
V
W
 
L
L
 
L
W
 
F
A
 
Y
N
 
N
P
 
K
Q
 
S
V
 
V
L
 
F
A
 
A
A
 
E
A
 
H
G
 
K
V
 
L
E
 
T
M
 
P
P
 
P
T
 
T
T
 
T
L
 
W
D
 
D
E
 
Q
L
 
L
F
 
L
A
 
D
A
 
N
G
 
V
E
 
A
A
 
K
I
 
L
R
 
K
E
 
K
A
 
A
G
 
G
Y
 
V
I
 
T
P
 
P
L
 
F
A
 
A
H
 
L
G
 
G
G
 
G
-
 
V
Q
 
E
A
 
I
W
|
W
Q
 
P
D
 
E
A
 
L
T
 
M
V
 
W
F
 
L
E
 
E
S
 
Y
V
 
L
L
 
V
L
 
D
A
 
R
S
 
I
G
 
G
G
 
G
T
 
P
E
 
Q
F
 
V
Y
 
F
Q
 
D
Q
 
K
A
 
-
L
 
I
V
 
R
E
 
N
L
 
G
D
 
D
P
 
A
E
 
S
A
 
G
L
 
W
G
 
G
S
 
D
E
 
P
R
 
A
M
 
V
I
 
L
E
 
K
A
 
A
L
 
A
E
 
Q
T
 
T
F
 
V
K
 
K
R
 
Q
L
 
L
R
 
V
E
 
D
-
 
E
-
 
G
L
 
A
M
 
F
D
 
G
A
 
K
D
 
G
M
 
F
S
 
S
G
 
S
R
 
V
D
 
S
W
 
Y
N
 
N
I
 
N
-
 
G
-
 
G
A
 
A
T
 
P
S
 
A
M
 
L
V
 
L
I
 
A
E
 
K
G
 
G
S
 
K
A
 
A
G
 
G
M
 
M
Q
 
H
L
 
L
M
 
M
G
 
G
D
 
S
W
|
W

Sites not aligning to the query:

1eljA The crystal structure of liganded maltodextrin-binding protein from pyrococcus furiosus (see paper)
26% identity, 45% coverage: 98:285/422 of query aligns to 70:243/380 of 1eljA

query
sites
1eljA
I
 
I
Q
 
G
E
 
K
W
 
F
G
 
A
E
 
E
L
 
A
G
 
G
L
 
L
L
 
L
G
 
E
E
 
P
L
 
I
D
 
D
E
 
E
V
 
Y
A
 
V
E
 
T
A
 
E
E
 
D
G
 
L
W
 
L
D
 
N
E
 
E
L
 
F
L
 
A
P
 
P
P
 
-
T
 
M
V
 
A
A
 
Q
D
 
D
V
 
A
M
 
M
R
 
Q
H
 
Y
N
 
K
G
 
G
S
 
H
Y
 
Y
V
 
Y
A
 
A
V
 
L
P
 
P
V
 
F
N
 
A
V
 
A
H
x
E
R
 
T
V
 
V
N
 
A
W
 
I
L
 
I
W
 
Y
A
 
-
N
 
N
P
 
K
Q
 
E
V
 
M
L
 
V
A
 
S
A
 
-
A
 
-
G
 
-
V
 
-
E
 
E
M
 
P
P
 
P
T
 
K
T
 
T
L
 
F
D
 
D
E
 
E
L
 
M
F
 
-
A
 
-
A
 
-
G
 
-
E
 
K
A
 
A
I
 
I
R
 
M
E
 
E
A
 
K
G
 
Y
Y
 
Y
I
 
D
P
 
P
L
 
A
A
 
N
H
 
E
G
 
K
-
 
Y
G
 
G
Q
 
I
A
 
A
W
 
W
Q
 
P
D
 
I
A
x
N
T
 
A
V
x
Y
F
 
F
E
 
I
S
 
S
V
 
A
L
 
I
L
 
A
A
 
Q
S
 
A
G
 
F
G
 
G
T
 
G
E
 
Y
F
 
Y
Y
 
F
Q
 
D
Q
 
D
A
 
-
L
 
-
V
 
-
E
 
K
L
 
T
D
 
E
P
 
Q
E
 
P
A
 
G
L
 
L
G
 
D
S
 
K
E
 
P
R
 
E
M
 
T
I
 
I
E
 
E
A
 
G
L
 
F
E
 
K
T
 
F
F
 
F
K
 
-
R
 
-
L
 
F
R
 
T
E
 
E
L
 
I
M
 
W
D
 
P
A
 
Y
D
 
M
M
 
A
S
 
P
G
 
T
R
 
G
D
 
D
W
 
Y
N
 
N
I
 
T
A
 
Q
T
 
Q
S
 
S
M
 
I
V
 
F
I
 
L
E
 
E
G
 
G
S
 
R
A
 
A
G
 
P
M
 
M
Q
 
M
L
 
V
M
 
N
G
 
G
D
 
P
W
|
W
A
 
S
K
 
I
G
 
N
E
 
D
F
 
V
T
 
K
A
 
K
A
 
A
G
 
G
L
 
I
T
 
N
A
 
F
G
 
G

Sites not aligning to the query:

4g68A Biochemical and structural insights into xylan utilization by the thermophilic bacteriumcaldanaerobius polysaccharolyticus (see paper)
27% identity, 28% coverage: 99:216/422 of query aligns to 70:186/392 of 4g68A

query
sites
4g68A
Q
 
Q
E
 
P
W
 
F
G
 
V
E
 
E
L
 
A
G
 
G
L
 
K
L
 
V
G
 
L
E
 
Q
L
 
L
D
 
D
E
 
S
V
 
Y
A
 
L
E
 
N
A
 
D
E
 
G
G
 
T
W
 
K
D
 
D
E
 
Q
L
 
L
L
 
L
P
 
P
P
 
G
T
 
S
V
 
F
A
 
-
D
 
D
V
 
N
M
 
V
R
 
T
H
 
Y
N
 
N
G
 
G
S
 
K
Y
 
I
V
 
Y
A
 
G
V
 
I
P
 
P
V
 
F
N
 
D
V
 
-
H
 
Q
R
x
Q
V
 
A
N
 
S
W
 
V
L
 
L
W
 
Y
A
 
I
N
 
N
P
 
K
Q
 
E
V
 
L
L
 
F
A
 
D
A
 
K
A
 
Y
G
 
N
V
 
V
E
 
K
M
 
V
P
 
P
T
 
T
T
 
T
L
 
F
D
 
S
E
 
E
L
 
L
F
 
I
A
 
D
A
 
A
G
 
I
E
 
K
A
 
T
I
 
F
R
 
K
E
 
S
A
 
K
G
 
G
Y
 
V
I
 
T
P
 
P
L
 
F
A
 
A
H
 
L
G
 
G
G
 
E
Q
 
K
-
 
D
A
 
E
W
|
W
Q
 
P
D
 
G
A
 
M
T
x
W
V
 
Y
F
 
Y
E
 
D
S
 
M
V
 
I
L
 
A
L
 
L
A
 
R
S
 
E
G
 
G
G
 
G
T
 
V
E
 
Q
F
 
L
Y
 
T
Q
 
R
Q
 
D
A
 
A
L
 
L

Sites not aligning to the query:

7c0kB Crystal structure of a dinucleotide-binding protein of abc transporter endogenously bound to uridylyl-3'-5'-phospho-guanosine (form ii) (see paper)
26% identity, 87% coverage: 33:398/422 of query aligns to 20:376/397 of 7c0kB

query
sites
7c0kB
E
 
E
V
 
L
L
 
W
H
 
H
W
 
G
W
 
F
T
 
T
S
 
-
G
 
G
G
 
G
E
 
A
A
 
P
R
 
K
A
 
A
A
 
A
-
 
L
-
 
E
N
 
N
V
 
L
L
 
V
K
 
V
E
|
E
L
 
F
M
 
N
E
 
K
A
|
A
E
 
Q
G
 
Q
Y
 
-
G
 
G
W
 
R
E
 
C
D
 
V
F
 
R
A
 
P
V
 
V
A
 
P
G
 
Q
G
 
G
G
 
G
G
x
Y
E
 
R
T
 
D
A
 
L
M
 
S
T
 
T
V
 
K
L
 
I
K
 
K
S
 
A
R
 
A
A
 
F
M
 
A
S
 
A
G
 
G
N
 
K
P
 
V
P
 
P
S
 
T
A
 
M
A
 
A
Q
 
Q
I
 
A
K
x
F
G
 
E
P
x
N
E
 
N
I
 
I
Q
 
A
E
 
L
W
 
Y
G
 
L
E
 
E
L
 
A
G
 
K
L
 
A
L
 
L
G
 
L
E
 
P
L
 
I
D
 
E
E
 
S
V
 
L
-
 
G
A
 
V
E
 
K
A
 
L
E
 
Q
G
 
G
W
 
V
D
 
N
E
 
L
L
 
-
L
 
-
P
 
-
P
 
-
T
 
T
V
 
F
A
 
L
D
 
N
V
 
A
M
 
V
R
 
R
H
 
F
N
 
G
G
 
G
S
 
V
Y
 
V
V
 
Y
A
 
G
V
 
V
P
 
P
V
 
F
N
 
N
V
 
-
H
 
K
R
x
S
V
 
I
N
 
Q
W
 
V
L
 
L
W
 
Y
A
 
Y
N
 
N
P
 
K
Q
 
D
V
 
L
L
 
L
A
 
K
A
 
K
A
 
H
G
 
G
V
 
V
E
 
P
M
 
V
P
 
P
T
 
A
T
 
T
L
 
L
D
 
E
E
 
E
L
 
F
F
 
V
A
 
A
A
 
A
G
 
A
E
 
K
A
 
K
I
 
L
R
 
S
E
 
R
A
 
-
G
 
-
Y
 
-
I
 
-
P
 
-
L
 
-
A
 
A
H
 
E
G
 
G
G
 
G
Q
 
P
A
 
V
W
 
Y
-
 
W
-
 
F
-
 
Q
Q
 
P
D
 
D
A
 
A
T
 
S
V
 
T
F
 
F
E
 
A
S
 
Y
V
 
F
L
 
F
L
 
F
A
 
N
S
 
L
G
 
G
G
 
G
T
 
S
E
 
Y
F
 
L
Y
 
K
Q
 
D
Q
 
G
A
 
K
L
 
L
V
 
V
E
 
-
L
 
-
D
 
-
P
 
-
E
 
-
A
 
-
L
 
L
G
 
N
S
 
S
E
 
K
R
 
E
M
 
A
I
 
V
E
 
E
A
 
A
L
 
L
E
 
T
T
 
L
F
 
-
K
 
-
R
 
-
L
 
-
R
 
-
E
 
-
L
 
L
M
 
Q
D
 
N
A
 
G
D
 
V
M
 
K
S
 
E
G
 
G
R
 
W
D
 
A
W
 
K
N
 
P
I
 
I
A
 
-
T
 
T
S
 
S
M
 
G
V
x
Y
I
 
I
E
x
N
G
 
Q
S
 
N
A
 
L
G
 
G
M
 
-
Q
 
-
L
 
-
M
 
S
G
 
G
D
 
P
W
 
Y
A
 
A
K
 
F
G
 
S
E
 
V
F
 
D
T
|
T
A
 
S
A
 
A
G
 
G
L
 
Y
T
 
T
A
 
-
G
 
-
E
 
-
E
x
Y
Y
 
Y
L
 
L
C
 
R
A
 
A
A
 
A
A
 
K
-
 
F
-
 
D
-
 
L
-
 
G
-
 
V
-
 
A
-
 
T
-
 
L
P
 
P
G
 
G
-
 
R
T
 
T
Q
 
K
D
 
G
A
 
Q
F
 
P
T
 
G
F
 
Y
N
 
G
I
 
L
-
 
V
-
x
Q
-
x
G
D
 
T
S
 
N
L
 
L
A
 
V
M
 
V
F
 
F
R
 
R
-
 
Q
V
 
A
E
 
S
G
 
K
E
 
E
E
 
E
R
 
Q
E
 
A
A
 
V
Q
 
A
Q
 
K
A
 
D
L
 
F
A
 
L
R
 
E
L
 
F
V
 
V
L
 
L
E
 
S
P
 
P
T
 
R
F
 
A
Q
 
Q
E
 
A
A
 
V
F
 
F
N
 
A
L
 
T
A
 
A
K
 
T
G
 
G
S
x
Y
I
 
V
P
 
P
A
 
V
R
 
T
P
 
E
D
 
G
-
 
A
L
 
L
D
 
K
M
 
D
S
 
P
G
 
V
F
 
Y
D
 
Q
V
 
A
C
 
Y
A
 
A
Q
 
A
Q
 
E
S
 
N
M
 
P
D
 
D
-
 
Y
-
 
A
D
 
T
F
 
I
Q
 
V
R
 
R
T
 
Q
A
 
S
E
 
R
E
 
Y
G
 
A
G
 
K
L
 
F
V
 
E
P
 
P
S
 
A
M
 
L
A
 
A
H
 
E
G
 
W
M
x
E
A
 
Q
V
 
I
R
|
R
A
x
F
D
 
D
V
 
I
Q
 
L
G
 
G
-
 
Q
A
 
A
I
 
I
F
 
K
D
 
E
V
 
A
V
 
I
T
 
L
N
 
N

7c0oB Crystal structure of a dinucleotide-binding protein (y56f) of abc transporter endogenously bound to uridylyl-3'-5'-phospho-guanosine (see paper)
26% identity, 87% coverage: 33:398/422 of query aligns to 19:375/397 of 7c0oB

query
sites
7c0oB
E
 
E
V
 
L
L
 
W
H
 
H
W
 
G
W
 
F
T
 
T
S
 
-
G
 
G
G
 
G
E
 
A
A
 
P
R
 
K
A
 
A
A
 
A
-
 
L
-
 
E
N
 
N
V
 
L
L
 
V
K
 
V
E
 
E
L
 
F
M
 
N
E
 
K
A
 
A
E
 
Q
G
 
Q
Y
 
-
G
 
G
W
 
R
E
 
C
D
 
V
F
 
R
A
 
P
V
 
V
A
 
P
G
 
Q
G
 
G
G
 
G
G
x
F
E
 
R
T
 
D
A
 
L
M
 
S
T
 
T
V
 
K
L
 
I
K
 
K
S
 
A
R
 
A
A
 
F
M
 
A
S
 
A
G
 
G
N
 
K
P
 
V
P
 
P
S
 
T
A
 
M
A
 
A
Q
 
Q
I
 
A
K
x
F
G
 
E
P
x
N
E
 
N
I
 
I
Q
 
A
E
 
L
W
 
Y
G
 
L
E
 
E
L
 
A
G
 
K
L
 
A
L
 
L
G
 
L
E
 
P
L
 
I
D
 
E
E
 
S
V
 
L
-
 
G
A
 
V
E
 
K
A
 
L
E
 
Q
G
 
G
W
 
V
D
 
N
E
 
L
L
 
-
L
 
-
P
 
-
P
 
-
T
 
T
V
 
F
A
 
L
D
 
N
V
 
A
M
 
V
R
 
R
H
 
F
N
 
G
G
 
G
S
 
V
Y
 
V
V
 
Y
A
 
G
V
 
V
P
 
P
V
 
F
N
 
N
V
 
-
H
 
K
R
x
S
V
 
I
N
 
Q
W
 
V
L
 
L
W
 
Y
A
 
Y
N
 
N
P
 
K
Q
 
D
V
 
L
L
 
L
A
 
K
A
 
K
A
 
H
G
 
G
V
 
V
E
 
P
M
 
V
P
 
P
T
 
A
T
 
T
L
 
L
D
 
E
E
 
E
L
 
F
F
 
V
A
 
A
A
 
A
G
 
A
E
 
K
A
 
K
I
 
L
R
 
S
E
 
R
A
 
-
G
 
-
Y
 
-
I
 
-
P
 
-
L
 
-
A
 
A
H
 
E
G
 
G
G
 
G
Q
 
P
A
 
V
W
 
Y
-
 
W
-
 
F
-
 
Q
Q
 
P
D
 
D
A
 
A
T
 
S
V
 
T
F
 
F
E
 
A
S
 
Y
V
 
F
L
 
F
L
 
F
A
x
N
S
x
L
G
 
G
G
 
G
T
 
S
E
 
Y
F
 
L
Y
 
K
Q
 
D
Q
 
G
A
 
K
L
 
L
V
 
V
E
 
-
L
 
-
D
 
-
P
 
-
E
 
-
A
 
-
L
 
L
G
 
N
S
 
S
E
 
K
R
 
E
M
 
A
I
 
V
E
 
E
A
 
A
L
 
L
E
 
T
T
 
L
F
 
-
K
 
-
R
 
-
L
 
-
R
 
-
E
 
-
L
 
L
M
 
Q
D
 
N
A
 
G
D
 
V
M
 
K
S
 
E
G
 
G
R
 
W
D
 
A
W
 
K
N
 
P
I
 
I
A
 
-
T
 
T
S
 
S
M
 
G
V
x
Y
I
 
I
E
x
N
G
 
Q
S
 
N
A
 
L
G
 
G
M
 
-
Q
 
-
L
 
-
M
 
S
G
 
G
D
 
P
W
 
Y
A
 
A
K
 
F
G
 
S
E
 
V
F
 
D
T
|
T
A
 
S
A
|
A
G
 
G
L
 
Y
T
 
T
A
 
-
G
 
-
E
 
-
E
x
Y
Y
 
Y
L
 
L
C
 
R
A
 
A
A
 
A
A
 
K
-
 
F
-
 
D
-
 
L
-
 
G
-
 
V
-
 
A
-
 
T
-
 
L
P
 
P
G
 
G
-
x
R
T
 
T
Q
 
K
D
 
G
A
 
Q
F
 
P
T
 
G
F
 
Y
N
 
G
I
 
L
-
 
V
-
x
Q
-
x
G
D
 
T
S
 
N
L
 
L
A
 
V
M
 
V
F
 
F
R
 
R
-
 
Q
V
 
A
E
 
S
G
 
K
E
 
E
E
 
E
R
 
Q
E
 
A
A
 
V
Q
 
A
Q
 
K
A
 
D
L
 
F
A
 
L
R
 
E
L
 
F
V
 
V
L
 
L
E
 
S
P
 
P
T
 
R
F
 
A
Q
 
Q
E
 
A
A
 
V
F
 
F
N
 
A
L
 
T
A
 
A
K
 
T
G
 
G
S
x
Y
I
 
V
P
 
P
A
 
V
R
 
T
P
 
E
D
 
G
-
 
A
L
 
L
D
 
K
M
 
D
S
 
P
G
 
V
F
 
Y
D
 
Q
V
 
A
C
 
Y
A
 
A
Q
 
A
Q
 
E
S
 
N
M
 
P
D
 
D
-
 
Y
-
 
A
D
 
T
F
 
I
Q
 
V
R
 
R
T
 
Q
A
 
S
E
 
R
E
 
Y
G
 
A
G
 
K
L
 
F
V
 
E
P
 
P
S
 
A
M
 
L
A
 
A
H
 
E
G
 
W
M
x
E
A
 
Q
V
 
I
R
|
R
A
x
F
D
 
D
V
 
I
Q
 
L
G
 
G
-
 
Q
A
 
A
I
 
I
F
 
K
D
 
E
V
 
A
V
 
I
T
 
L
N
 
N

7c0kA Crystal structure of a dinucleotide-binding protein of abc transporter endogenously bound to uridylyl-3'-5'-phospho-guanosine (form ii) (see paper)
26% identity, 87% coverage: 33:398/422 of query aligns to 19:375/396 of 7c0kA

query
sites
7c0kA
E
 
E
V
 
L
L
 
W
H
 
H
W
 
G
W
 
F
T
 
T
S
 
-
G
|
G
G
|
G
E
 
A
A
 
P
R
 
K
A
 
A
A
 
A
-
 
L
-
 
E
N
 
N
V
 
L
L
 
V
K
 
V
E
 
E
L
 
F
M
 
N
E
 
K
A
 
A
E
 
Q
G
 
Q
Y
 
-
G
 
G
W
 
R
E
 
C
D
 
V
F
 
R
A
 
P
V
 
V
A
 
P
G
 
Q
G
 
G
G
 
G
G
x
Y
E
x
R
T
 
D
A
 
L
M
 
S
T
 
T
V
 
K
L
 
I
K
 
K
S
 
A
R
 
A
A
 
F
M
 
A
S
 
A
G
 
G
N
 
K
P
 
V
P
 
P
S
 
T
A
 
M
A
 
A
Q
 
Q
I
 
A
K
x
F
G
 
E
P
x
N
E
 
N
I
 
I
Q
 
A
E
 
L
W
 
Y
G
 
L
E
 
E
L
 
A
G
 
K
L
 
A
L
 
L
G
 
L
E
 
P
L
 
I
D
 
E
E
 
S
V
 
L
-
 
G
A
 
V
E
 
K
A
 
L
E
 
Q
G
 
G
W
 
V
D
 
N
E
 
L
L
 
-
L
 
-
P
 
-
P
 
-
T
 
T
V
 
F
A
 
L
D
 
N
V
 
A
M
 
V
R
 
R
H
 
F
N
 
G
G
 
G
S
 
V
Y
 
V
V
 
Y
A
 
G
V
 
V
P
 
P
V
 
F
N
 
N
V
 
-
H
 
K
R
x
S
V
 
I
N
 
Q
W
 
V
L
 
L
W
 
Y
A
 
Y
N
 
N
P
x
K
Q
 
D
V
 
L
L
 
L
A
x
K
A
 
K
A
 
H
G
 
G
V
 
V
E
 
P
M
 
V
P
 
P
T
 
A
T
 
T
L
 
L
D
 
E
E
 
E
L
 
F
F
 
V
A
 
A
A
 
A
G
 
A
E
 
K
A
 
K
I
 
L
R
 
S
E
 
R
A
 
-
G
 
-
Y
 
-
I
 
-
P
 
-
L
 
-
A
 
A
H
 
E
G
 
G
G
 
G
Q
 
P
A
 
V
W
 
Y
-
 
W
-
 
F
-
 
Q
Q
 
P
D
 
D
A
 
A
T
 
S
V
 
T
F
 
F
E
 
A
S
 
Y
V
 
F
L
 
F
L
 
F
A
 
N
S
 
L
G
 
G
G
 
G
T
 
S
E
 
Y
F
 
L
Y
 
K
Q
 
D
Q
 
G
A
 
K
L
 
L
V
 
V
E
 
-
L
 
-
D
 
-
P
 
-
E
 
-
A
 
-
L
 
L
G
 
N
S
 
S
E
 
K
R
 
E
M
 
A
I
 
V
E
 
E
A
 
A
L
 
L
E
 
T
T
 
L
F
 
-
K
 
-
R
 
-
L
 
-
R
 
-
E
 
-
L
 
L
M
 
Q
D
 
N
A
 
G
D
 
V
M
 
K
S
 
E
G
 
G
R
 
W
D
 
A
W
 
K
N
 
P
I
 
I
A
 
-
T
 
T
S
 
S
M
 
G
V
x
Y
I
 
I
E
x
N
G
 
Q
S
 
N
A
 
L
G
 
G
M
 
-
Q
 
-
L
 
-
M
 
S
G
 
G
D
 
P
W
 
Y
A
 
A
K
 
F
G
 
S
E
 
V
F
 
D
T
|
T
A
 
S
A
|
A
G
 
G
L
 
Y
T
 
T
A
 
-
G
 
-
E
 
-
E
x
Y
Y
 
Y
L
 
L
C
 
R
A
 
A
A
 
A
A
 
K
-
 
F
-
 
D
-
 
L
-
 
G
-
 
V
-
 
A
-
 
T
-
 
L
P
 
P
G
 
G
-
 
R
T
 
T
Q
 
K
D
 
G
A
 
Q
F
 
P
T
 
G
F
 
Y
N
 
G
I
 
L
-
 
V
-
x
Q
-
x
G
D
 
T
S
 
N
L
 
L
A
 
V
M
 
V
F
 
F
R
 
R
-
 
Q
V
 
A
E
 
S
G
 
K
E
 
E
E
 
E
R
 
Q
E
 
A
A
 
V
Q
 
A
Q
 
K
A
 
D
L
 
F
A
 
L
R
 
E
L
 
F
V
 
V
L
 
L
E
 
S
P
 
P
T
 
R
F
 
A
Q
 
Q
E
 
A
A
 
V
F
 
F
N
 
A
L
 
T
A
 
A
K
 
T
G
 
G
S
x
Y
I
 
V
P
 
P
A
 
V
R
 
T
P
 
E
D
 
G
-
 
A
L
 
L
D
 
K
M
 
D
S
 
P
G
 
V
F
 
Y
D
 
Q
V
 
A
C
 
Y
A
 
A
Q
 
A
Q
 
E
S
 
N
M
 
P
D
 
D
-
 
Y
-
 
A
D
 
T
F
 
I
Q
 
V
R
 
R
T
 
Q
A
 
S
E
 
R
E
 
Y
G
 
A
G
 
K
L
x
F
V
x
E
P
 
P
S
 
A
M
 
L
A
 
A
H
 
E
G
 
W
M
x
E
A
 
Q
V
 
I
R
|
R
A
x
F
D
 
D
V
 
I
Q
 
L
G
 
G
-
 
Q
A
 
A
I
 
I
F
 
K
D
 
E
V
 
A
V
 
I
T
 
L
N
 
N

3oo6A Crystal structures and biochemical characterization of the bacterial solute receptor acbh reveal an unprecedented exclusive substrate preference for b-d-galactopyranose (see paper)
23% identity, 45% coverage: 80:270/422 of query aligns to 50:238/390 of 3oo6A

query
sites
3oo6A
S
 
S
R
 
N
A
 
Y
M
 
L
S
 
Q
G
 
G
N
 
T
P
 
P
P
 
D
S
 
S
A
 
L
A
 
A
Q
 
T
-
 
W
I
 
F
K
 
A
G
 
G
P
 
Y
E
x
R
I
 
L
Q
 
Q
E
 
F
W
 
F
G
 
A
E
 
A
L
 
Q
G
 
G
L
 
L
L
 
L
G
 
T
E
 
P
L
 
I
D
 
D
E
 
D
V
 
V
A
 
-
E
 
-
A
 
-
E
 
-
G
 
-
W
 
W
D
 
D
E
 
K
L
 
I
L
 
-
P
 
G
P
 
G
T
 
T
V
 
F
A
 
N
D
 
D
V
 
A
M
 
A
R
 
K
H
 
S
-
 
L
-
 
S
-
 
K
-
 
G
-
 
L
N
 
D
G
 
G
S
 
H
Y
 
Y
V
 
Y
A
 
L
V
 
V
P
 
P
V
 
L
N
 
-
V
 
-
H
 
-
R
 
-
V
 
Y
N
 
N
W
x
Y
L
 
P
W
|
W
A
 
V
-
 
V
-
 
F
-
 
Y
N
 
N
P
 
K
Q
 
S
V
 
V
L
 
F
A
 
Q
A
 
S
A
 
K
G
 
G
V
 
Y
E
 
E
M
 
V
P
 
P
T
 
A
T
 
S
L
 
W
D
 
E
E
 
A
L
 
F
F
 
I
A
 
A
A
 
L
G
 
A
E
 
R
A
 
K
I
 
M
R
 
Q
E
 
S
A
 
D
G
 
G
Y
 
L
I
 
V
P
 
P
L
 
L
A
 
A
H
 
F
G
 
A
G
 
D
Q
 
K
-
 
D
A
 
G
W
|
W
Q
 
P
D
 
A
A
 
L
T
 
G
V
 
T
F
 
F
E
 
D
S
 
I
V
 
L
L
 
N
L
 
L
A
 
R
S
 
I
G
 
N
G
 
G
T
 
Y
E
 
D
F
 
Y
Y
 
H
Q
 
I
Q
 
K
A
 
L
L
 
M
V
 
K
E
 
H
L
 
E
D
 
V
P
 
P
E
 
W
A
 
T
L
 
-
G
 
-
S
 
D
E
 
P
R
 
G
M
 
V
I
 
T
E
 
K
A
 
V
L
 
F
E
 
D
T
 
Q
F
 
W
K
 
R
R
 
E
L
 
L
R
 
A
E
 
A
L
 
Y
M
 
Q
D
 
Q
A
 
K
D
 
G
M
 
A
S
 
N
G
 
G
R
 
R
D
 
T
W
 
W
N
 
Q
I
 
D
A
 
A
T
 
A
S
 
K
M
 
A
V
 
L
I
 
E
E
 
N
G
 
K
S
 
Q
A
 
A
G
 
G
M
 
M
Q
 
M
L
 
F
M
 
Q
G
 
G

Sites not aligning to the query:

Query Sequence

>WP_086510781.1 NCBI__GCF_002151265.1:WP_086510781.1
MTLLANPFRKTALALATAAAASLTFSIQAAEVEVLHWWTSGGEARAANVLKELMEAEGYG
WEDFAVAGGGGETAMTVLKSRAMSGNPPSAAQIKGPEIQEWGELGLLGELDEVAEAEGWD
ELLPPTVADVMRHNGSYVAVPVNVHRVNWLWANPQVLAAAGVEMPTTLDELFAAGEAIRE
AGYIPLAHGGQAWQDATVFESVLLASGGTEFYQQALVELDPEALGSERMIEALETFKRLR
ELMDADMSGRDWNIATSMVIEGSAGMQLMGDWAKGEFTAAGLTAGEEYLCAAAPGTQDAF
TFNIDSLAMFRVEGEEREAQQALARLVLEPTFQEAFNLAKGSIPARPDLDMSGFDVCAQQ
SMDDFQRTAEEGGLVPSMAHGMAVRADVQGAIFDVVTNYFNSRDMAAEEAARRMVNAAQA
AL

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory