SitesBLAST – Find functional sites

 

SitesBLAST

Comparing SMc03160 FitnessBrowser__Smeli:SMc03160 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

6rjmB Complex structure of virulence factor sgha and its hydrolysis product glucose (see paper)
78% identity, 98% coverage: 6:455/458 of query aligns to 4:453/456 of 6rjmB

query
sites
6rjmB
K
 
K
K
 
A
L
 
L
A
 
A
A
 
A
R
 
R
F
 
F
P
 
P
G
 
G
D
 
D
F
 
F
V
 
L
F
 
F
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
F
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
A
S
 
T
K
 
K
A
 
V
D
 
D
G
 
G
R
 
R
K
 
K
A
 
P
S
 
S
I
 
I
W
 
W
D
 
D
A
 
A
F
 
F
S
 
C
N
 
N
M
 
M
P
 
P
G
 
G
R
 
H
V
 
V
Y
 
F
G
 
G
R
 
R
H
 
H
N
 
N
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
E
Q
 
D
D
 
D
L
 
L
D
 
D
L
 
L
I
 
I
K
 
K
S
 
E
L
 
M
G
 
G
V
 
V
E
 
E
A
 
A
Y
 
Y
R
 
R
F
 
F
S
 
S
I
 
I
A
 
A
W
 
W
P
 
P
R
 
R
I
 
I
V
 
I
P
 
P
E
 
D
G
 
G
T
 
F
G
 
G
P
 
P
I
 
I
N
 
N
E
 
E
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
D
R
 
R
L
 
L
V
 
V
D
 
D
G
 
G
L
 
C
K
 
K
A
 
A
R
 
R
G
 
G
I
 
I
K
 
K
A
 
T
F
 
Y
A
 
A
T
 
T
L
 
L
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
L
A
 
T
L
 
L
M
 
M
G
 
G
D
 
D
G
 
G
G
 
G
W
 
W
T
 
A
A
 
S
R
 
R
T
 
S
T
 
T
A
 
A
Y
 
H
A
 
A
Y
 
F
Q
 
Q
R
 
R
Y
 
Y
A
 
A
K
 
K
T
 
T
V
 
V
I
 
M
A
 
A
R
 
R
L
 
L
G
 
G
D
 
D
R
 
R
L
 
L
D
 
D
A
 
A
V
 
V
A
 
A
T
 
T
F
 
F
N
|
N
E
|
E
P
 
P
W
 
W
C
 
C
S
 
A
V
 
V
W
 
W
L
 
L
G
 
S
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
I
H
 
H
A
 
A
P
 
P
G
 
G
E
 
E
R
 
R
N
 
N
M
 
M
D
 
E
A
 
A
A
 
A
L
 
L
A
 
A
A
 
A
L
 
M
H
 
H
F
 
H
T
 
I
N
 
N
L
 
L
A
 
A
H
 
H
G
 
G
L
 
F
G
 
G
V
 
V
A
 
E
A
 
A
I
 
S
R
 
R
S
 
H
E
 
V
R
 
A
P
 
P
E
 
K
L
 
V
P
 
P
V
 
V
G
 
G
I
 
L
V
 
V
I
 
L
N
 
N
A
 
A
H
 
H
S
 
S
V
 
V
Y
 
I
P
 
P
G
 
A
S
 
S
N
 
N
S
 
S
A
 
D
E
 
A
D
 
D
K
 
M
A
 
K
A
 
A
A
 
A
E
 
E
R
 
R
A
 
A
F
 
F
D
 
Q
F
 
F
H
 
H
N
 
N
G
 
G
V
 
A
F
 
F
F
 
F
D
 
D
P
 
P
I
 
V
F
 
F
K
 
K
G
 
G
E
 
E
Y
 
Y
P
 
P
E
 
A
D
 
E
F
 
M
L
 
I
S
 
E
A
 
A
L
 
L
G
 
G
E
 
S
R
 
R
M
 
M
P
 
P
A
 
V
I
 
V
E
 
E
D
 
A
G
 
E
D
 
D
M
 
L
A
 
S
T
 
I
I
 
I
A
 
S
Q
 
Q
P
 
K
L
 
L
D
 
D
W
 
W
W
 
W
G
 
G
L
 
L
N
 
N
Y
 
Y
Y
|
Y
T
 
T
P
 
P
M
 
M
R
 
R
V
 
V
S
 
A
A
 
D
D
 
D
P
 
A
A
 
T
K
 
E
G
 
G
A
 
A
E
 
E
Y
 
F
P
 
P
A
 
A
T
 
T
V
 
K
N
 
Q
A
 
A
K
 
P
P
 
A
V
 
V
S
 
S
N
 
D
V
 
V
K
 
K
T
 
T
D
 
D
I
 
I
G
 
G
W
|
W
E
 
E
V
 
V
Y
 
Y
A
 
A
P
 
P
A
 
A
L
 
L
G
 
H
S
 
S
L
 
L
V
 
V
E
 
E
T
 
T
L
 
L
N
 
Y
A
 
E
R
 
R
Y
 
Y
R
 
E
L
 
L
P
 
P
D
 
D
C
 
C
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
C
Y
 
Y
N
 
N
M
 
M
G
 
G
V
 
V
E
 
E
N
 
N
G
 
G
T
 
E
V
 
V
D
 
D
D
 
D
Q
 
Q
P
 
P
R
 
R
L
 
L
D
 
D
Y
 
Y
I
 
Y
S
 
A
D
 
E
H
 
H
L
 
L
A
 
G
V
 
I
T
 
V
A
 
A
D
 
D
L
 
L
I
 
V
A
 
K
K
 
D
G
 
G
Y
 
Y
P
 
P
M
 
M
R
 
R
G
 
G
Y
 
Y
F
 
F
A
 
A
W
|
W
S
 
S
L
 
L
M
 
M
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
R
M
 
M
R
 
R
F
|
F
G
 
G
I
 
L
V
 
V
H
 
H
V
 
V
D
 
D
Y
 
Y
E
 
E
T
 
T
Q
 
Q
V
 
V
R
 
R
T
 
T
I
 
L
K
 
K
K
 
N
S
 
S
G
 
G
R
 
K
W
 
W
Y
 
Y
K
 
S
D
 
A
L
 
L
A
 
A
E
 
S
R
 
G
F
 
F
P
 
P
S
 
K
G
 
G
N
 
N
H
 
H

6rk2A Complex structure of virulence factor sgha mutant with its substrate sag (see paper)
77% identity, 98% coverage: 2:452/458 of query aligns to 4:454/454 of 6rk2A

query
sites
6rk2A
M
 
M
I
 
T
E
 
D
A
 
H
K
 
K
K
 
A
L
 
L
A
 
A
A
 
A
R
 
R
F
 
F
P
 
P
G
 
G
D
 
D
F
 
F
V
 
L
F
 
F
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
F
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
A
S
 
T
K
 
K
A
 
V
D
 
D
G
 
G
R
 
R
K
 
K
A
 
P
S
 
S
I
 
I
W
 
W
D
 
D
A
 
A
F
 
F
S
 
C
N
 
N
M
 
M
P
 
P
G
 
G
R
 
H
V
 
V
Y
 
F
G
 
G
R
 
R
H
 
H
N
 
N
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
E
Q
 
D
D
 
D
L
 
L
D
 
D
L
 
L
I
 
I
K
 
K
S
 
E
L
 
M
G
 
G
V
 
V
E
 
E
A
 
A
Y
 
Y
R
 
R
F
 
F
S
 
S
I
 
I
A
 
A
W
 
W
P
 
P
R
 
R
I
 
I
V
 
I
P
 
P
E
 
D
G
 
G
T
 
F
G
 
G
P
 
P
I
 
I
N
 
N
E
 
E
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
D
R
 
R
L
 
L
V
 
V
D
 
D
G
 
G
L
 
C
K
 
K
A
 
A
R
 
R
G
 
G
I
 
I
K
 
K
A
 
T
F
 
Y
A
 
A
T
 
T
L
 
L
Y
 
Y
H
|
H
W
|
W
D
 
D
L
 
L
P
 
P
L
 
L
A
 
T
L
 
L
M
 
M
G
 
G
D
 
D
G
 
G
G
 
G
W
 
W
T
 
A
A
 
S
R
 
R
T
 
S
T
 
T
A
 
A
Y
 
H
A
 
A
Y
 
F
Q
 
Q
R
 
R
Y
 
Y
A
 
A
K
 
K
T
 
T
V
 
V
I
 
M
A
 
A
R
 
R
L
 
L
G
 
G
D
 
D
R
 
R
L
 
L
D
 
D
A
 
A
V
 
V
A
 
A
T
 
T
F
 
F
N
 
N
E
 
S
P
 
P
W
 
W
C
 
C
S
 
A
V
 
V
W
 
W
L
 
L
G
 
S
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
I
H
 
H
A
 
A
P
 
P
G
 
G
E
 
E
R
 
R
N
 
N
M
 
M
D
 
E
A
 
A
A
 
A
L
 
L
A
 
A
A
 
A
L
 
M
H
 
H
F
 
H
T
 
I
N
 
N
L
 
L
A
 
A
H
 
H
G
 
G
L
 
F
G
 
G
V
 
V
A
 
E
A
 
A
I
 
S
R
 
R
S
 
H
E
 
V
R
 
A
P
 
P
E
 
K
L
 
V
P
 
P
V
 
V
G
 
G
I
 
L
V
 
V
I
 
L
N
|
N
A
 
A
H
 
H
S
 
S
V
 
V
Y
 
I
P
 
P
G
 
A
S
 
S
N
 
N
S
 
S
A
 
D
E
 
A
D
 
D
K
 
M
A
 
K
A
 
A
A
 
A
E
 
E
R
 
R
A
 
A
F
 
F
D
 
Q
F
 
F
H
 
H
N
 
N
G
 
G
V
 
A
F
 
F
F
 
F
D
 
D
P
 
P
I
 
V
F
 
F
K
 
K
G
 
G
E
 
E
Y
 
Y
P
 
P
E
 
A
D
 
E
F
 
M
L
 
I
S
 
E
A
 
A
L
 
L
G
 
G
E
 
S
R
 
R
M
 
M
P
 
P
A
 
V
I
 
V
E
 
E
D
 
A
G
 
E
D
 
D
M
 
L
A
 
S
T
 
I
I
 
I
A
 
S
Q
 
Q
P
 
K
L
 
L
D
 
D
W
 
W
W
 
W
G
 
G
L
 
L
N
 
N
Y
 
Y
Y
|
Y
T
 
T
P
 
P
M
 
M
R
 
R
V
 
V
S
 
A
A
 
D
D
 
D
P
 
A
A
 
T
K
 
E
G
 
G
A
 
A
E
 
E
Y
 
F
P
 
P
A
 
A
T
 
T
V
 
K
N
 
Q
A
 
A
K
 
P
P
 
A
V
 
V
S
 
S
N
 
D
V
 
V
K
 
K
T
 
T
D
 
D
I
 
I
G
 
G
W
 
W
E
 
E
V
 
V
Y
 
Y
A
 
A
P
 
P
A
 
A
L
 
L
G
 
H
S
 
S
L
 
L
V
 
V
E
 
E
T
 
T
L
 
L
N
 
Y
A
 
E
R
 
R
Y
 
Y
R
 
E
L
 
L
P
 
P
D
 
D
C
 
C
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
C
Y
 
Y
N
 
N
M
 
M
G
 
G
V
 
V
E
 
E
N
 
N
G
 
G
T
 
E
V
 
V
D
 
D
D
 
D
Q
 
Q
P
 
P
R
 
R
L
 
L
D
 
D
Y
 
Y
I
 
Y
S
 
A
D
 
E
H
 
H
L
 
L
A
 
G
V
 
I
T
 
V
A
 
A
D
 
D
L
 
L
I
 
V
A
 
K
K
 
D
G
 
G
Y
 
Y
P
 
P
M
 
M
R
 
R
G
 
G
Y
 
Y
F
 
F
A
 
A
W
|
W
S
 
S
L
 
L
M
 
M
D
 
D
N
 
N
F
 
F
E
|
E
W
 
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
R
M
 
M
R
 
R
F
|
F
G
 
G
I
 
L
V
 
V
H
 
H
V
 
V
D
 
D
Y
 
Y
E
 
E
T
 
T
Q
 
Q
V
 
V
R
 
R
T
 
T
I
 
L
K
 
K
K
 
N
S
 
S
G
 
G
R
 
K
W
 
W
Y
 
Y
K
 
S
D
 
A
L
 
L
A
 
A
E
 
S
R
 
G
F
 
F
P
 
P
S
 
K

6rjoA Complex structure of virulence factor sgha with its substrate analog salicin (see paper)
77% identity, 98% coverage: 2:452/458 of query aligns to 4:454/454 of 6rjoA

query
sites
6rjoA
M
 
M
I
 
T
E
 
D
A
 
H
K
 
K
K
 
A
L
 
L
A
 
A
A
 
A
R
 
R
F
 
F
P
 
P
G
 
G
D
 
D
F
 
F
V
 
L
F
 
F
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
F
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
A
S
 
T
K
 
K
A
 
V
D
 
D
G
 
G
R
 
R
K
 
K
A
 
P
S
 
S
I
 
I
W
 
W
D
 
D
A
 
A
F
 
F
S
 
C
N
 
N
M
 
M
P
 
P
G
 
G
R
 
H
V
 
V
Y
 
F
G
 
G
R
 
R
H
 
H
N
 
N
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
E
Q
 
D
D
 
D
L
 
L
D
 
D
L
 
L
I
 
I
K
 
K
S
 
E
L
 
M
G
 
G
V
 
V
E
 
E
A
 
A
Y
 
Y
R
 
R
F
 
F
S
 
S
I
 
I
A
 
A
W
 
W
P
 
P
R
 
R
I
 
I
V
 
I
P
 
P
E
 
D
G
 
G
T
 
F
G
 
G
P
 
P
I
 
I
N
 
N
E
 
E
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
D
R
 
R
L
 
L
V
 
V
D
 
D
G
 
G
L
 
C
K
 
K
A
 
A
R
 
R
G
 
G
I
 
I
K
 
K
A
 
T
F
 
Y
A
 
A
T
 
T
L
 
L
Y
 
Y
H
 
H
W
|
W
D
 
D
L
 
L
P
 
P
L
 
L
A
 
T
L
 
L
M
 
M
G
 
G
D
 
D
G
 
G
G
 
G
W
 
W
T
 
A
A
 
S
R
 
R
T
 
S
T
 
T
A
 
A
Y
 
H
A
 
A
Y
 
F
Q
 
Q
R
 
R
Y
 
Y
A
 
A
K
 
K
T
 
T
V
 
V
I
 
M
A
 
A
R
 
R
L
 
L
G
 
G
D
 
D
R
 
R
L
 
L
D
 
D
A
 
A
V
 
V
A
 
A
T
 
T
F
 
F
N
 
N
E
 
S
P
 
P
W
 
W
C
|
C
S
 
A
V
 
V
W
 
W
L
 
L
G
 
S
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
I
H
 
H
A
 
A
P
 
P
G
 
G
E
 
E
R
 
R
N
 
N
M
 
M
D
 
E
A
 
A
A
 
A
L
 
L
A
 
A
A
 
A
L
 
M
H
 
H
F
 
H
T
 
I
N
 
N
L
 
L
A
 
A
H
 
H
G
 
G
L
 
F
G
 
G
V
 
V
A
 
E
A
 
A
I
 
S
R
 
R
S
 
H
E
 
V
R
 
A
P
 
P
E
 
K
L
 
V
P
 
P
V
 
V
G
 
G
I
 
L
V
 
V
I
 
L
N
 
N
A
 
A
H
 
H
S
 
S
V
 
V
Y
 
I
P
 
P
G
 
A
S
 
S
N
 
N
S
 
S
A
 
D
E
 
A
D
 
D
K
 
M
A
 
K
A
 
A
A
 
A
E
 
E
R
 
R
A
 
A
F
 
F
D
 
Q
F
 
F
H
 
H
N
 
N
G
 
G
V
 
A
F
 
F
F
 
F
D
 
D
P
 
P
I
 
V
F
 
F
K
 
K
G
 
G
E
 
E
Y
 
Y
P
 
P
E
 
A
D
 
E
F
 
M
L
 
I
S
 
E
A
 
A
L
 
L
G
 
G
E
 
S
R
 
R
M
 
M
P
 
P
A
 
V
I
 
V
E
 
E
D
 
A
G
 
E
D
 
D
M
 
L
A
 
S
T
 
I
I
 
I
A
 
S
Q
 
Q
P
 
K
L
 
L
D
 
D
W
 
W
W
 
W
G
 
G
L
 
L
N
 
N
Y
 
Y
Y
 
Y
T
 
T
P
 
P
M
 
M
R
 
R
V
 
V
S
 
A
A
 
D
D
 
D
P
 
A
A
 
T
K
 
E
G
 
G
A
 
A
E
 
E
Y
 
F
P
 
P
A
 
A
T
 
T
V
 
K
N
 
Q
A
 
A
K
 
P
P
 
A
V
 
V
S
 
S
N
 
D
V
 
V
K
 
K
T
 
T
D
 
D
I
 
I
G
 
G
W
 
W
E
 
E
V
 
V
Y
 
Y
A
 
A
P
 
P
A
 
A
L
 
L
G
 
H
S
 
S
L
 
L
V
 
V
E
 
E
T
 
T
L
 
L
N
 
Y
A
 
E
R
 
R
Y
 
Y
R
 
E
L
 
L
P
 
P
D
 
D
C
 
C
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
C
Y
 
Y
N
 
N
M
 
M
G
 
G
V
 
V
E
 
E
N
 
N
G
 
G
T
 
E
V
 
V
D
 
D
D
 
D
Q
 
Q
P
 
P
R
 
R
L
 
L
D
 
D
Y
 
Y
I
 
Y
S
 
A
D
 
E
H
 
H
L
 
L
A
 
G
V
 
I
T
 
V
A
 
A
D
 
D
L
 
L
I
 
V
A
 
K
K
 
D
G
 
G
Y
 
Y
P
 
P
M
 
M
R
 
R
G
 
G
Y
 
Y
F
 
F
A
 
A
W
|
W
S
 
S
L
 
L
M
 
M
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
R
M
 
M
R
 
R
F
|
F
G
 
G
I
 
L
V
 
V
H
 
H
V
 
V
D
 
D
Y
 
Y
E
 
E
T
 
T
Q
 
Q
V
 
V
R
 
R
T
 
T
I
 
L
K
 
K
K
 
N
S
 
S
G
 
G
R
 
K
W
 
W
Y
 
Y
K
 
S
D
 
A
L
 
L
A
 
A
E
 
S
R
 
G
F
 
F
P
 
P
S
 
K

P12614 Beta-glucosidase; Amygdalase; Beta-D-glucoside glucohydrolase; Cellobiase; Gentiobiase; EC 3.2.1.21 from Agrobacterium sp. (strain ATCC 21400)
75% identity, 99% coverage: 2:455/458 of query aligns to 1:454/459 of P12614

query
sites
P12614
M
 
M
I
 
T
E
 
D
A
 
P
K
 
N
K
 
T
L
 
L
A
 
A
A
 
A
R
 
R
F
 
F
P
 
P
G
 
G
D
 
D
F
 
F
V
 
L
F
 
F
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
F
Q
 
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
T
K
 
K
A
 
A
D
 
D
G
 
G
R
 
R
K
 
K
A
 
P
S
 
S
I
 
I
W
 
W
D
 
D
A
 
A
F
 
F
S
 
C
N
 
N
M
 
M
P
 
P
G
 
G
R
 
H
V
 
V
Y
 
F
G
 
G
R
 
R
H
 
H
N
 
N
G
 
G
D
 
D
V
 
I
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
E
Q
 
E
D
 
D
L
 
L
D
 
D
L
 
L
I
 
I
K
 
K
S
 
E
L
 
M
G
 
G
V
 
V
E
 
E
A
 
A
Y
 
Y
R
 
R
F
 
F
S
 
S
I
 
L
A
 
A
W
 
W
P
 
P
R
 
R
I
 
I
V
 
I
P
 
P
E
 
D
G
 
G
T
 
F
G
 
G
P
 
P
I
 
I
N
 
N
E
 
E
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
D
R
 
R
L
 
L
V
 
V
D
 
D
G
 
G
L
 
C
K
 
K
A
 
A
R
 
R
G
 
G
I
 
I
K
 
K
A
 
T
F
 
Y
A
 
A
T
 
T
L
 
L
Y
 
Y
H
 
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
L
A
 
T
L
 
L
M
 
M
G
 
G
D
 
D
G
 
G
G
 
G
W
 
W
T
 
A
A
 
S
R
 
R
T
 
S
T
 
T
A
 
A
Y
 
H
A
 
A
Y
 
F
Q
 
Q
R
 
R
Y
 
Y
A
 
A
K
 
K
T
 
T
V
 
V
I
 
M
A
 
A
R
 
R
L
 
L
G
 
G
D
 
D
R
 
R
L
 
L
D
 
D
A
 
A
V
 
V
A
 
A
T
 
T
F
 
F
N
 
N
E
 
E
P
 
P
W
 
W
C
 
C
S
 
A
V
 
V
W
 
W
L
 
L
G
 
S
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
E
R
 
R
N
 
N
M
 
M
D
 
E
A
 
A
A
 
A
L
 
L
A
 
A
A
 
A
L
 
M
H
 
H
F
 
H
T
 
I
N
 
N
L
 
L
A
 
A
H
 
H
G
 
G
L
 
F
G
 
G
V
 
V
A
 
E
A
 
A
I
 
S
R
 
R
S
 
H
E
 
V
R
 
A
P
 
P
E
 
K
L
 
V
P
 
P
V
 
V
G
 
G
I
 
L
V
 
V
I
 
L
N
 
N
A
 
A
H
 
H
S
 
S
V
 
A
Y
 
I
P
 
P
G
 
A
S
 
S
N
 
D
S
 
G
A
 
E
E
 
A
D
 
D
K
 
L
A
 
K
A
 
A
A
 
A
E
 
E
R
 
R
A
 
A
F
 
F
D
 
Q
F
 
F
H
 
H
N
 
N
G
 
G
V
 
A
F
 
F
F
 
F
D
 
D
P
 
P
I
 
V
F
 
F
K
 
K
G
 
G
E
 
E
Y
 
Y
P
 
P
E
 
A
D
 
E
F
 
M
L
 
M
S
 
E
A
 
A
L
 
L
G
 
G
E
 
D
R
 
R
M
 
M
P
 
P
A
 
V
I
 
V
E
 
E
D
 
A
G
 
E
D
 
D
M
 
L
A
 
G
T
 
I
I
 
I
A
 
S
Q
 
Q
P
 
K
L
 
L
D
 
D
W
 
W
W
 
W
G
 
G
L
 
L
N
 
N
Y
 
Y
Y
 
Y
T
 
T
P
 
P
M
 
M
R
 
R
V
 
V
S
 
A
A
 
D
D
 
D
P
 
A
A
 
T
K
 
P
G
 
G
A
 
V
E
 
E
Y
 
F
P
 
P
A
 
A
T
 
T
V
 
M
N
 
P
A
 
A
K
 
P
P
 
A
V
 
V
S
 
S
N
 
D
V
 
V
K
 
K
T
 
T
D
 
D
I
 
I
G
 
G
W
 
W
E
 
E
V
 
V
Y
 
Y
A
 
A
P
 
P
A
 
A
L
 
L
G
 
H
S
 
T
L
 
L
V
 
V
E
 
E
T
 
T
L
 
L
N
 
Y
A
 
E
R
 
R
Y
 
Y
R
 
D
L
 
L
P
 
P
D
 
E
C
 
C
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
C
Y
 
Y
N
 
N
M
 
M
G
 
G
V
 
V
E
 
E
N
 
N
G
 
G
T
 
Q
V
 
V
D
 
N
D
 
D
Q
 
Q
P
 
P
R
 
R
L
 
L
D
 
D
Y
 
Y
I
 
Y
S
 
A
D
 
E
H
 
H
L
 
L
A
 
G
V
 
I
T
 
V
A
 
A
D
 
D
L
 
L
I
 
I
A
 
R
K
 
D
G
 
G
Y
 
Y
P
 
P
M
 
M
R
 
R
G
 
G
Y
 
Y
F
 
F
A
 
A
W
 
W
S
 
S
L
 
L
M
 
M
D
 
D
N
 
N
F
 
F
E
 
E
W
 
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
R
M
 
M
R
 
R
F
 
F
G
 
G
I
 
L
V
 
V
H
 
H
V
 
V
D
 
D
Y
 
Y
E
 
Q
T
 
T
Q
 
Q
V
 
V
R
 
R
T
 
T
I
 
V
K
 
K
K
 
N
S
 
S
G
 
G
R
 
K
W
 
W
Y
 
Y
K
 
S
D
 
A
L
 
L
A
 
A
E
 
S
R
 
G
F
 
F
P
 
P
S
 
K
G
 
G
N
 
N
H
 
H

5ns8A Crystal structure of beta-glucosidase bglm-g1 mutant h75r from marine metagenome in complex with inhibitor 1-deoxynojirimycin (see paper)
49% identity, 94% coverage: 16:444/458 of query aligns to 9:434/440 of 5ns8A

query
sites
5ns8A
F
 
F
V
 
T
F
 
W
G
 
G
V
 
V
A
 
S
T
 
T
A
 
S
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
A
S
 
A
K
 
N
A
 
Q
D
 
G
G
 
G
R
 
R
K
 
G
A
 
P
S
 
S
I
 
I
W
 
W
D
 
D
A
 
T
F
 
F
S
 
S
N
 
K
M
 
I
P
 
P
G
 
G
R
 
A
V
 
V
Y
 
A
G
 
N
R
 
G
H
 
D
N
 
N
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
H
R
 
R
L
 
Y
E
 
N
Q
 
E
D
 
D
L
 
L
D
 
D
L
 
L
I
 
M
K
 
K
S
 
W
L
 
L
G
 
G
V
 
V
E
 
G
A
 
A
Y
 
Y
R
 
R
F
 
F
S
 
S
I
 
I
A
 
A
W
 
W
P
 
P
R
 
R
I
 
V
V
 
I
P
 
P
E
 
S
G
 
G
T
 
Y
G
 
G
P
 
A
I
 
L
N
 
N
E
 
K
K
 
E
G
 
G
L
 
M
D
 
D
F
 
F
Y
 
Y
D
 
D
R
 
R
L
 
L
V
 
I
D
 
D
G
 
G
L
 
A
K
 
L
A
 
E
R
 
R
G
 
G
I
 
I
K
 
T
A
 
P
F
 
W
A
 
P
T
 
T
L
 
L
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
Q
A
 
S
L
 
L
M
 
Q
G
 
D
D
 
K
G
 
G
G
 
G
W
 
W
T
 
N
A
 
N
R
 
R
T
 
D
T
 
C
A
 
A
Y
 
Y
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
Q
T
 
K
V
 
M
I
 
A
A
 
E
R
 
A
L
 
F
G
 
S
D
 
D
R
 
R
L
 
L
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
I
N
|
N
E
|
E
P
 
P
W
 
F
C
 
C
S
 
S
V
 
A
W
 
W
L
 
L
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
M
A
 
A
P
 
P
G
 
G
E
 
I
R
 
K
N
 
D
M
 
L
D
 
K
A
 
T
A
 
G
L
 
I
A
 
N
A
 
A
L
 
S
H
 
H
F
 
H
T
 
L
N
 
L
L
 
L
A
 
G
H
 
H
G
 
G
L
 
L
G
 
A
V
 
T
A
 
K
A
 
A
I
 
I
R
 
R
S
 
E
E
 
V
R
 
S
P
 
S
E
 
E
L
 
L
P
 
K
V
 
V
G
 
G
I
 
I
V
 
T
I
 
L
N
 
N
A
 
F
H
 
T
S
 
P
V
 
A
Y
 
I
P
 
T
G
 
L
S
 
G
N
 
E
S
 
S
A
 
S
E
 
E
D
 
D
K
 
K
A
 
L
A
 
A
A
 
V
E
 
E
R
 
L
A
 
A
F
 
D
D
 
G
F
 
F
H
 
D
N
 
N
G
 
R
V
 
W
F
 
F
F
 
G
D
 
D
P
 
P
I
 
V
F
 
F
K
 
K
G
 
A
E
 
K
Y
 
Y
P
 
P
E
 
E
D
 
D
F
 
I
L
 
V
S
 
K
A
 
A
L
 
F
G
 
G
E
 
K
R
 
E
M
 
V
P
 
P
A
 
-
I
 
I
E
 
H
D
 
P
G
 
G
D
 
D
M
 
M
A
 
E
T
 
I
I
 
I
A
 
S
Q
 
T
P
 
P
L
 
L
D
 
D
W
 
Y
W
 
L
G
 
G
L
 
L
N
 
N
Y
 
Y
Y
|
Y
T
 
F
P
 
R
M
 
Q
R
 
T
V
 
V
S
 
-
A
 
-
D
 
-
P
 
-
A
 
-
K
 
-
G
 
-
A
 
-
E
 
E
Y
 
Y
P
 
D
A
 
A
T
 
T
V
 
A
N
 
K
A
 
P
K
 
L
P
 
P
V
 
Y
S
 
K
N
 
Q
V
 
V
-
 
T
-
 
A
-
 
P
-
 
N
-
 
V
-
 
E
K
 
R
T
 
T
D
 
G
I
 
M
G
 
G
W
 
W
E
 
E
V
 
V
Y
 
H
A
 
A
P
 
Q
A
 
S
L
 
F
G
 
T
S
 
E
L
 
L
V
 
L
E
 
E
T
 
R
L
 
V
N
 
S
A
 
K
R
 
E
Y
 
Y
R
 
K
L
 
P
P
 
K
D
 
E
C
 
I
Y
 
F
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
S
C
 
A
Y
 
W
N
 
D
M
 
D
G
 
E
V
 
V
E
 
V
N
 
D
G
 
G
T
 
K
V
 
V
D
 
D
D
 
D
Q
 
P
P
 
N
R
 
R
L
 
V
D
 
S
Y
 
Y
I
 
L
S
 
E
D
 
R
H
 
H
L
 
L
A
 
D
V
 
A
T
 
M
A
 
F
D
 
A
L
 
A
I
 
K
A
 
N
K
 
K
G
 
G
Y
 
V
P
 
P
M
 
I
R
 
S
G
 
G
Y
 
Y
F
 
F
A
 
A
W
|
W
S
 
S
L
 
L
M
 
I
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
Y
G
 
G
Y
 
Y
R
 
A
M
 
K
R
 
R
F
|
F
G
 
G
I
 
I
V
 
I
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
Q
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
P
K
 
K
K
 
S
S
 
S
G
 
A
R
 
Y
W
 
Y
Y
 
Y
K
 
Q

6z1mA Structure of an ancestral glycosidase (family 1) bound to heme (see paper)
49% identity, 95% coverage: 11:446/458 of query aligns to 2:417/423 of 6z1mA

query
sites
6z1mA
R
 
K
F
 
F
P
 
P
G
 
K
D
 
D
F
 
F
V
 
L
F
 
W
G
 
G
V
 
A
A
 
A
T
 
T
A
 
A
S
 
A
F
 
Y
Q
 
Q
I
 
I
E
 
E
G
 
G
A
 
A
S
 
A
K
 
N
A
 
E
D
 
D
G
 
G
R
 
R
K
 
G
A
 
P
S
 
S
I
 
I
W
 
W
D
 
D
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
K
V
 
V
Y
 
H
G
 
N
R
 
G
H
 
D
N
 
N
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
H
R
 
R
L
 
Y
E
 
K
Q
 
E
D
 
D
L
 
V
D
 
E
L
 
L
I
 
M
K
 
K
S
 
E
L
 
L
G
 
G
V
 
L
E
 
N
A
 
A
Y
 
Y
R
 
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
E
G
 
G
P
 
K
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
N
L
 
L
V
 
I
D
 
D
G
 
E
L
 
L
K
 
L
A
 
E
R
 
N
G
 
G
I
 
I
K
 
E
A
 
P
F
 
F
A
 
V
T
 
T
L
 
L
Y
 
Y
H
 
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
Q
A
 
A
L
 
L
M
 
Q
G
 
D
D
 
K
G
 
G
G
 
G
W
 
W
T
 
E
A
 
N
R
 
R
T
 
E
T
 
T
A
 
V
Y
 
D
A
 
A
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
A
K
 
R
T
 
V
V
 
C
I
 
F
A
 
E
R
 
R
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
Y
V
 
W
A
 
I
T
 
T
F
 
F
N
 
N
E
 
E
P
|
P
W
x
N
C
 
V
S
 
F
V
 
A
W
 
V
L
 
L
G
 
G
H
 
Y
L
 
L
Y
 
S
G
 
G
V
 
V
H
 
H
A
 
P
P
 
P
G
 
G
E
 
M
R
 
K
N
 
D
M
 
L
D
 
K
A
 
K
A
 
A
L
 
F
A
 
R
A
 
A
L
 
A
H
 
H
F
 
N
T
x
L
N
x
L
L
 
L
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
A
I
 
Y
R
 
R
S
 
E
E
 
I
R
 
S
P
 
Q
E
 
N
L
 
G
P
 
Q
V
 
I
G
 
G
I
 
I
V
 
T
I
x
L
N
 
N
A
x
L
H
 
S
S
 
P
V
 
V
Y
 
Y
P
 
P
G
 
A
S
 
S
-
 
D
N
 
N
S
 
E
A
 
E
E
 
E
D
 
D
K
 
K
A
 
A
A
 
A
A
 
A
E
 
E
R
 
R
A
 
A
F
 
D
D
 
Q
F
 
F
H
x
N
N
 
N
G
 
W
V
 
-
F
|
F
F
 
L
D
 
D
P
 
P
I
 
I
F
 
F
K
|
K
G
 
G
E
 
K
Y
|
Y
P
 
-
E
 
E
D
 
H
F
 
M
L
 
L
S
 
E
A
 
R
L
 
L
G
 
G
E
 
E
R
 
Q
-
 
I
-
 
A
-
 
A
-
 
N
-
 
G
-
 
G
-
 
E
M
 
L
P
 
P
A
 
E
I
 
I
E
 
T
D
 
D
G
 
-
D
 
E
M
 
M
A
 
E
T
 
I
I
 
L
A
 
S
Q
 
A
P
 
S
L
|
L
D
 
D
W
 
F
W
 
I
G
 
G
L
 
L
N
 
N
Y
 
Y
Y
 
Y
T
 
T
P
 
-
M
 
-
R
 
-
V
 
-
S
 
-
A
 
-
D
 
-
P
 
-
A
 
-
K
 
-
G
 
-
A
 
-
E
 
-
Y
 
-
P
 
-
A
 
-
T
 
-
V
 
-
N
 
-
A
 
-
K
 
-
P
 
-
V
 
-
S
 
S
N
 
N
V
 
L
K
 
-
T
 
T
D
 
D
I
 
M
G
 
G
W
 
W
E
 
E
V
 
I
Y
 
Y
A
 
P
P
 
E
A
 
G
L
 
L
G
 
Y
S
 
D
L
 
L
V
 
L
E
 
K
T
x
R
L
 
I
N
 
H
A
 
E
R
 
K
Y
|
Y
R
 
N
L
 
L
P
 
P
D
 
-
C
 
I
Y
 
Y
I
 
I
T
 
T
E
 
E
N
 
N
G
 
G
A
 
M
C
 
A
Y
 
V
N
 
D
M
 
D
G
 
E
V
 
V
E
 
E
N
 
D
G
 
G
T
 
A
V
 
V
D
x
H
D
 
D
Q
 
T
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
E
H
 
H
L
 
L
A
 
E
V
 
A
T
 
V
A
 
H
D
 
K
L
 
A
I
 
I
A
 
E
K
 
E
G
 
G
Y
 
V
P
 
N
M
 
V
R
 
R
G
 
G
Y
 
Y
F
 
F
A
 
V
W
 
W
S
 
S
L
 
L
M
 
M
D
 
D
N
 
N
F
 
F
E
 
E
W
 
W
A
 
A
E
 
N
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
 
F
G
 
G
I
 
L
V
 
I
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
K
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
T
I
 
P
K
 
K
K
|
K
S
 
S
G
 
A
R
 
Y
W
 
W
Y
 
Y
K
 
R
D
 
E
L
 
V

2jalB Beta-glucosidase from thermotoga maritima in complex with cyclophellitol (see paper)
46% identity, 96% coverage: 9:448/458 of query aligns to 2:439/444 of 2jalB

query
sites
2jalB
A
 
V
A
 
K
R
 
K
F
 
F
P
 
P
G
 
E
D
 
G
F
 
F
V
 
L
F
 
W
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
P
K
 
L
A
 
A
D
 
D
G
 
G
R
 
A
K
 
G
A
 
M
S
 
S
I
 
I
W
 
W
D
 
H
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
N
V
 
V
Y
 
K
G
 
N
R
 
G
H
 
D
N
 
T
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
K
Q
 
E
D
 
D
L
 
I
D
 
E
L
 
I
I
 
I
K
 
E
S
 
K
L
 
L
G
 
G
V
 
V
E
 
K
A
 
A
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
T
G
 
G
P
 
R
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
R
L
 
I
V
 
I
D
 
D
G
 
T
L
 
L
K
 
L
A
 
E
R
 
K
G
 
G
I
 
I
K
 
T
A
 
P
F
 
F
A
 
V
T
 
T
L
 
I
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
F
A
 
A
L
 
L
M
 
Q
G
 
L
D
 
K
G
 
G
G
 
G
W
 
W
T
 
A
A
 
N
R
 
R
T
 
E
T
 
I
A
 
A
Y
 
D
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
R
T
 
V
V
 
L
I
 
F
A
 
E
R
 
N
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
L
N
 
N
E
|
E
P
 
P
W
 
W
C
x
V
S
 
V
V
 
A
W
 
I
L
 
V
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
M
R
 
R
N
 
D
M
 
I
D
 
Y
A
 
V
A
 
A
L
 
F
A
 
R
A
 
A
L
 
V
H
 
H
F
 
N
T
 
L
N
 
L
L
 
R
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
V
I
 
F
R
 
R
S
 
E
E
 
T
R
 
V
P
 
K
E
 
D
L
 
G
P
 
K
V
 
I
G
 
G
I
 
I
V
 
V
I
 
F
N
 
N
A
 
N
H
 
G
S
 
Y
V
 
F
Y
 
E
P
 
P
G
 
A
S
 
S
N
 
E
S
 
K
A
 
E
E
 
E
D
 
D
K
 
I
A
 
R
A
 
A
A
 
V
E
 
R
R
 
F
A
 
M
F
 
H
D
 
Q
F
 
F
H
 
N
N
 
N
-
 
Y
G
 
P
V
 
L
F
 
F
F
 
L
D
 
N
P
 
P
I
 
I
F
 
Y
K
 
R
G
 
G
E
 
D
Y
 
Y
P
 
P
E
 
E
D
 
L
F
 
V
L
 
L
S
 
E
A
 
F
L
 
A
G
 
R
E
 
E
R
 
Y
M
 
L
P
 
P
A
 
E
I
 
N
E
 
Y
D
 
K
G
x
D
D
 
D
M
 
M
A
 
S
T
x
E
I
 
I
A
 
Q
Q
 
E
P
 
K
L
 
I
D
 
D
W
 
F
W
 
V
G
 
G
L
 
L
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
G
M
 
H
R
 
L
V
 
V
S
 
K
A
 
F
D
 
D
P
 
P
A
 
-
K
 
-
G
 
-
A
 
-
E
 
D
Y
 
A
P
 
P
A
 
A
T
 
K
V
 
V
N
 
S
A
 
F
K
 
V
P
 
E
V
 
R
S
 
D
N
 
L
V
 
P
K
 
K
T
 
T
D
 
A
I
 
M
G
 
G
W
 
W
E
 
E
V
 
I
Y
 
V
A
 
P
P
 
E
A
 
G
L
 
I
G
 
Y
S
 
W
L
 
I
V
 
L
E
 
K
T
 
K
L
 
V
N
 
K
A
 
E
R
 
E
Y
 
Y
R
 
N
L
 
P
P
 
P
D
 
E
C
 
V
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
A
Y
 
F
N
 
D
M
 
D
G
 
V
V
 
V
-
 
S
E
 
E
N
 
D
G
 
G
T
 
R
V
 
V
D
 
H
D
 
D
Q
 
Q
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
A
H
 
H
L
 
I
A
 
G
V
 
Q
T
 
A
A
 
W
D
 
K
L
 
A
I
 
I
A
 
Q
K
 
E
G
 
G
Y
 
V
P
 
P
M
 
L
R
 
K
G
 
G
Y
 
Y
F
 
F
A
 
V
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
|
F
G
 
G
I
 
I
V
 
V
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
S
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
V
K
 
K
K
 
D
S
 
S
G
 
G
R
 
Y
W
 
W
Y
 
Y
K
 
S
D
 
N
L
 
V
A
 
V
E
 
K

5ossB Beta-glucosidase from thermotoga maritima in complex with gluco-1h- imidazole (see paper)
46% identity, 96% coverage: 9:448/458 of query aligns to 1:438/443 of 5ossB

query
sites
5ossB
A
 
V
A
 
K
R
 
K
F
 
F
P
 
P
G
 
E
D
 
G
F
 
F
V
 
L
F
 
W
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
P
K
 
L
A
 
A
D
 
D
G
 
G
R
 
A
K
 
G
A
 
M
S
 
S
I
 
I
W
 
W
D
 
H
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
N
V
 
V
Y
 
K
G
 
N
R
 
G
H
 
D
N
 
T
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
K
Q
 
E
D
 
D
L
 
I
D
 
E
L
 
I
I
 
I
K
 
E
S
 
K
L
 
L
G
 
G
V
 
V
E
 
K
A
 
A
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
T
G
 
G
P
 
R
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
R
L
 
I
V
 
I
D
 
D
G
 
T
L
 
L
K
 
L
A
 
E
R
 
K
G
 
G
I
 
I
K
 
T
A
 
P
F
 
F
A
 
V
T
 
T
L
 
I
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
F
A
 
A
L
 
L
M
 
Q
G
 
L
D
 
K
G
 
G
G
 
G
W
 
W
T
 
A
A
 
N
R
 
R
T
 
E
T
 
I
A
 
A
Y
 
D
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
R
T
 
V
V
 
L
I
 
F
A
 
E
R
 
N
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
L
N
 
N
E
|
E
P
 
P
W
 
W
C
x
V
S
 
V
V
 
A
W
 
I
L
 
V
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
M
R
 
R
N
 
D
M
 
I
D
 
Y
A
 
V
A
 
A
L
 
F
A
 
R
A
 
A
L
 
V
H
 
H
F
 
N
T
 
L
N
 
L
L
 
R
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
V
I
 
F
R
 
R
S
 
E
E
 
T
R
 
V
P
 
K
E
 
D
L
 
G
P
 
K
V
 
I
G
 
G
I
 
I
V
 
V
I
 
F
N
 
N
A
 
N
H
 
G
S
 
Y
V
 
F
Y
 
E
P
 
P
G
 
A
S
 
S
N
 
E
S
 
K
A
 
E
E
 
E
D
 
D
K
 
I
A
 
R
A
 
A
A
 
V
E
 
R
R
 
F
A
 
M
F
 
H
D
 
Q
F
 
F
H
 
N
N
 
N
-
 
Y
G
 
P
V
 
L
F
 
F
F
 
L
D
 
N
P
 
P
I
 
I
F
 
Y
K
 
R
G
 
G
E
 
D
Y
 
Y
P
 
P
E
 
E
D
 
L
F
 
V
L
 
L
S
 
E
A
 
F
L
 
A
G
 
R
E
 
E
R
 
Y
M
 
L
P
 
P
A
 
E
I
 
N
E
 
Y
D
 
K
G
 
D
D
 
D
M
 
M
A
 
S
T
 
E
I
 
I
A
 
Q
Q
 
E
P
 
K
L
 
I
D
 
D
W
 
F
W
 
V
G
 
G
L
 
L
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
G
M
 
H
R
 
L
V
 
V
S
 
K
A
 
F
D
 
D
P
 
P
A
 
-
K
 
-
G
 
-
A
 
-
E
 
D
Y
 
A
P
 
P
A
 
A
T
 
K
V
 
V
N
 
S
A
 
F
K
 
V
P
 
E
V
 
R
S
 
D
N
 
L
V
 
P
K
 
K
T
 
T
D
 
A
I
 
M
G
 
G
W
 
W
E
 
E
V
 
I
Y
 
V
A
 
P
P
 
E
A
 
G
L
 
I
G
 
Y
S
 
W
L
 
I
V
 
L
E
 
K
T
 
K
L
 
V
N
 
K
A
 
E
R
 
E
Y
 
Y
R
 
N
L
 
P
P
 
P
D
 
E
C
 
V
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
A
Y
 
F
N
 
D
M
 
D
G
 
V
V
 
V
-
 
S
E
 
E
N
 
D
G
 
G
T
 
R
V
 
V
D
 
H
D
 
D
Q
 
Q
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
A
H
 
H
L
 
I
A
 
G
V
 
Q
T
 
A
A
 
W
D
 
K
L
 
A
I
 
I
A
 
Q
K
 
E
G
 
G
Y
 
V
P
 
P
M
 
L
R
 
K
G
 
G
Y
 
Y
F
 
F
A
 
V
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
|
F
G
 
G
I
 
I
V
 
V
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
S
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
V
K
 
K
K
 
D
S
 
S
G
 
G
R
 
Y
W
 
W
Y
 
Y
K
 
S
D
 
N
L
 
V
A
 
V
E
 
K

5n6tA Thermotoga maritima family 1 glycoside hydrolase complexed with a cyclophellitol analogue transition state mimic (see paper)
46% identity, 96% coverage: 9:448/458 of query aligns to 1:438/443 of 5n6tA

query
sites
5n6tA
A
 
V
A
 
K
R
 
K
F
 
F
P
 
P
G
 
E
D
 
G
F
 
F
V
 
L
F
 
W
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
P
K
 
L
A
 
A
D
 
D
G
 
G
R
 
A
K
 
G
A
 
M
S
 
S
I
 
I
W
 
W
D
 
H
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
N
V
 
V
Y
 
K
G
 
N
R
 
G
H
 
D
N
 
T
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
K
Q
 
E
D
 
D
L
 
I
D
 
E
L
 
I
I
 
I
K
 
E
S
 
K
L
 
L
G
 
G
V
 
V
E
 
K
A
 
A
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
T
G
 
G
P
 
R
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
R
L
 
I
V
 
I
D
 
D
G
 
T
L
 
L
K
 
L
A
 
E
R
 
K
G
 
G
I
 
I
K
 
T
A
 
P
F
 
F
A
 
V
T
 
T
L
 
I
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
F
A
 
A
L
 
L
M
 
Q
G
 
L
D
 
K
G
 
G
G
 
G
W
 
W
T
 
A
A
 
N
R
 
R
T
 
E
T
 
I
A
 
A
Y
 
D
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
R
T
 
V
V
 
L
I
 
F
A
 
E
R
 
N
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
L
N
|
N
E
|
E
P
 
P
W
 
W
C
x
V
S
 
V
V
 
A
W
 
I
L
 
V
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
M
R
 
R
N
 
D
M
 
I
D
 
Y
A
 
V
A
 
A
L
 
F
A
 
R
A
 
A
L
 
V
H
 
H
F
 
N
T
 
L
N
 
L
L
 
R
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
V
I
 
F
R
 
R
S
 
E
E
 
T
R
 
V
P
 
K
E
 
D
L
 
G
P
 
K
V
 
I
G
 
G
I
 
I
V
 
V
I
 
F
N
 
N
A
 
N
H
 
G
S
 
Y
V
 
F
Y
 
E
P
 
P
G
 
A
S
 
S
N
 
E
S
 
K
A
 
E
E
 
E
D
 
D
K
 
I
A
 
R
A
 
A
A
 
V
E
 
R
R
 
F
A
 
M
F
 
H
D
 
Q
F
 
F
H
 
N
N
 
N
-
 
Y
G
 
P
V
 
L
F
 
F
F
 
L
D
 
N
P
 
P
I
 
I
F
 
Y
K
 
R
G
 
G
E
 
D
Y
 
Y
P
 
P
E
 
E
D
 
L
F
 
V
L
 
L
S
 
E
A
 
F
L
 
A
G
 
R
E
 
E
R
 
Y
M
 
L
P
 
P
A
 
E
I
 
N
E
 
Y
D
 
K
G
 
D
D
 
D
M
 
M
A
 
S
T
 
E
I
 
I
A
 
Q
Q
 
E
P
 
K
L
 
I
D
 
D
W
 
F
W
 
V
G
 
G
L
 
L
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
G
M
 
H
R
 
L
V
 
V
S
 
K
A
 
F
D
 
D
P
 
P
A
 
-
K
 
-
G
 
-
A
 
-
E
 
D
Y
 
A
P
 
P
A
 
A
T
 
K
V
 
V
N
 
S
A
 
F
K
 
V
P
 
E
V
 
R
S
 
D
N
 
L
V
 
P
K
 
K
T
 
T
D
 
A
I
 
M
G
 
G
W
 
W
E
 
E
V
 
I
Y
 
V
A
 
P
P
 
E
A
 
G
L
 
I
G
 
Y
S
 
W
L
 
I
V
 
L
E
 
K
T
 
K
L
 
V
N
 
K
A
 
E
R
 
E
Y
 
Y
R
 
N
L
 
P
P
 
P
D
 
E
C
 
V
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
A
Y
 
F
N
 
D
M
 
D
G
 
V
V
 
V
-
 
S
E
 
E
N
 
D
G
 
G
T
 
R
V
 
V
D
 
H
D
 
D
Q
 
Q
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
A
H
 
H
L
 
I
A
 
G
V
 
Q
T
 
A
A
 
W
D
 
K
L
 
A
I
 
I
A
 
Q
K
 
E
G
 
G
Y
 
V
P
 
P
M
 
L
R
 
K
G
 
G
Y
 
Y
F
 
F
A
 
V
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
|
F
G
 
G
I
 
I
V
 
V
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
S
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
V
K
 
K
K
 
D
S
 
S
G
 
G
R
 
Y
W
 
W
Y
 
Y
K
 
S
D
 
N
L
 
V
A
 
V
E
 
K

5n6sA Thermotoga maritima family 1 glycoside hydrolase complexed with carba- cyclophellitol transition state mimic (see paper)
46% identity, 96% coverage: 9:448/458 of query aligns to 1:438/443 of 5n6sA

query
sites
5n6sA
A
 
V
A
 
K
R
 
K
F
 
F
P
 
P
G
 
E
D
 
G
F
 
F
V
 
L
F
 
W
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
P
K
 
L
A
 
A
D
 
D
G
 
G
R
 
A
K
 
G
A
 
M
S
 
S
I
 
I
W
 
W
D
 
H
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
N
V
 
V
Y
 
K
G
 
N
R
 
G
H
 
D
N
 
T
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
K
Q
 
E
D
 
D
L
 
I
D
 
E
L
 
I
I
 
I
K
 
E
S
 
K
L
 
L
G
 
G
V
 
V
E
 
K
A
 
A
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
T
G
 
G
P
 
R
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
R
L
 
I
V
 
I
D
 
D
G
 
T
L
 
L
K
 
L
A
 
E
R
 
K
G
 
G
I
 
I
K
 
T
A
 
P
F
 
F
A
 
V
T
 
T
L
 
I
Y
 
Y
H
|
H
W
|
W
D
 
D
L
 
L
P
 
P
L
 
F
A
 
A
L
 
L
M
 
Q
G
 
L
D
 
K
G
 
G
G
 
G
W
 
W
T
 
A
A
 
N
R
 
R
T
 
E
T
 
I
A
 
A
Y
 
D
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
R
T
 
V
V
 
L
I
 
F
A
 
E
R
 
N
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
L
N
|
N
E
|
E
P
 
P
W
|
W
C
x
V
S
 
V
V
 
A
W
 
I
L
 
V
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
M
R
 
R
N
 
D
M
 
I
D
 
Y
A
 
V
A
 
A
L
 
F
A
 
R
A
 
A
L
 
V
H
 
H
F
 
N
T
 
L
N
 
L
L
 
R
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
V
I
 
F
R
 
R
S
 
E
E
 
T
R
 
V
P
 
K
E
 
D
L
 
G
P
 
K
V
 
I
G
 
G
I
 
I
V
 
V
I
 
F
N
 
N
A
 
N
H
 
G
S
 
Y
V
 
F
Y
 
E
P
 
P
G
 
A
S
 
S
N
 
E
S
 
K
A
 
E
E
 
E
D
 
D
K
 
I
A
 
R
A
 
A
A
 
V
E
 
R
R
 
F
A
 
M
F
 
H
D
 
Q
F
 
F
H
 
N
N
 
N
-
 
Y
G
 
P
V
 
L
F
 
F
F
 
L
D
 
N
P
 
P
I
 
I
F
 
Y
K
 
R
G
 
G
E
 
D
Y
 
Y
P
 
P
E
 
E
D
 
L
F
 
V
L
 
L
S
 
E
A
 
F
L
 
A
G
 
R
E
 
E
R
 
Y
M
 
L
P
 
P
A
 
E
I
 
N
E
 
Y
D
 
K
G
 
D
D
 
D
M
 
M
A
 
S
T
 
E
I
 
I
A
 
Q
Q
 
E
P
 
K
L
 
I
D
 
D
W
 
F
W
 
V
G
 
G
L
 
L
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
G
M
 
H
R
 
L
V
 
V
S
 
K
A
 
F
D
 
D
P
 
P
A
 
-
K
 
-
G
 
-
A
 
-
E
 
D
Y
 
A
P
 
P
A
 
A
T
 
K
V
 
V
N
 
S
A
 
F
K
 
V
P
 
E
V
 
R
S
 
D
N
 
L
V
 
P
K
 
K
T
 
T
D
 
A
I
 
M
G
 
G
W
 
W
E
 
E
V
 
I
Y
 
V
A
 
P
P
 
E
A
 
G
L
 
I
G
 
Y
S
 
W
L
 
I
V
 
L
E
 
K
T
 
K
L
 
V
N
 
K
A
 
E
R
 
E
Y
 
Y
R
 
N
L
 
P
P
 
P
D
 
E
C
 
V
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
A
Y
 
F
N
 
D
M
 
D
G
 
V
V
 
V
-
 
S
E
 
E
N
 
D
G
 
G
T
 
R
V
 
V
D
 
H
D
 
D
Q
 
Q
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
A
H
 
H
L
 
I
A
 
G
V
 
Q
T
 
A
A
 
W
D
 
K
L
 
A
I
 
I
A
 
Q
K
 
E
G
 
G
Y
 
V
P
 
P
M
 
L
R
 
K
G
 
G
Y
 
Y
F
 
F
A
 
V
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
|
F
G
 
G
I
 
I
V
 
V
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
S
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
V
K
 
K
K
 
D
S
 
S
G
 
G
R
 
Y
W
 
W
Y
 
Y
K
 
S
D
 
N
L
 
V
A
 
V
E
 
K

2wc4A Structure of family 1 beta-glucosidase from thermotoga maritima in complex with 3-imino-2-thia-(+)-castanospermine (see paper)
46% identity, 96% coverage: 9:448/458 of query aligns to 1:438/443 of 2wc4A

query
sites
2wc4A
A
 
V
A
 
K
R
 
K
F
 
F
P
 
P
G
 
E
D
 
G
F
 
F
V
 
L
F
 
W
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
P
K
 
L
A
 
A
D
 
D
G
 
G
R
 
A
K
 
G
A
 
M
S
 
S
I
 
I
W
 
W
D
 
H
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
N
V
 
V
Y
 
K
G
 
N
R
 
G
H
 
D
N
 
T
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
K
Q
 
E
D
 
D
L
 
I
D
 
E
L
 
I
I
 
I
K
 
E
S
 
K
L
 
L
G
 
G
V
 
V
E
 
K
A
 
A
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
T
G
 
G
P
 
R
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
R
L
 
I
V
 
I
D
 
D
G
 
T
L
 
L
K
 
L
A
 
E
R
 
K
G
 
G
I
 
I
K
 
T
A
 
P
F
 
F
A
 
V
T
 
T
L
 
I
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
F
A
 
A
L
 
L
M
 
Q
G
 
L
D
 
K
G
 
G
G
 
G
W
 
W
T
 
A
A
 
N
R
 
R
T
 
E
T
 
I
A
 
A
Y
 
D
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
R
T
 
V
V
 
L
I
 
F
A
 
E
R
 
N
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
L
N
|
N
E
|
E
P
 
P
W
 
W
C
x
V
S
 
V
V
 
A
W
 
I
L
 
V
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
M
R
 
R
N
 
D
M
 
I
D
 
Y
A
 
V
A
 
A
L
 
F
A
 
R
A
 
A
L
 
V
H
 
H
F
 
N
T
 
L
N
 
L
L
 
R
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
V
I
 
F
R
 
R
S
 
E
E
 
T
R
 
V
P
 
K
E
 
D
L
 
G
P
 
K
V
 
I
G
 
G
I
 
I
V
 
V
I
 
F
N
 
N
A
 
N
H
 
G
S
 
Y
V
 
F
Y
 
E
P
 
P
G
 
A
S
 
S
N
 
E
S
 
K
A
 
E
E
 
E
D
 
D
K
 
I
A
 
R
A
 
A
A
 
V
E
 
R
R
 
F
A
 
M
F
 
H
D
 
Q
F
 
F
H
 
N
N
 
N
-
 
Y
G
 
P
V
 
L
F
 
F
F
 
L
D
 
N
P
 
P
I
 
I
F
 
Y
K
 
R
G
 
G
E
 
D
Y
 
Y
P
 
P
E
 
E
D
 
L
F
 
V
L
 
L
S
 
E
A
 
F
L
 
A
G
 
R
E
 
E
R
 
Y
M
 
L
P
 
P
A
 
E
I
 
N
E
 
Y
D
 
K
G
 
D
D
 
D
M
 
M
A
 
S
T
 
E
I
 
I
A
 
Q
Q
 
E
P
 
K
L
 
I
D
 
D
W
 
F
W
 
V
G
 
G
L
 
L
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
G
M
 
H
R
 
L
V
 
V
S
 
K
A
 
F
D
 
D
P
 
P
A
 
-
K
 
-
G
 
-
A
 
-
E
 
D
Y
 
A
P
 
P
A
 
A
T
 
K
V
 
V
N
 
S
A
 
F
K
 
V
P
 
E
V
 
R
S
 
D
N
 
L
V
 
P
K
 
K
T
 
T
D
 
A
I
 
M
G
 
G
W
|
W
E
 
E
V
 
I
Y
 
V
A
 
P
P
 
E
A
 
G
L
 
I
G
 
Y
S
 
W
L
 
I
V
 
L
E
 
K
T
 
K
L
 
V
N
 
K
A
 
E
R
 
E
Y
 
Y
R
 
N
L
 
P
P
 
P
D
 
E
C
 
V
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
A
Y
 
F
N
 
D
M
 
D
G
 
V
V
 
V
-
 
S
E
 
E
N
 
D
G
 
G
T
 
R
V
 
V
D
 
H
D
 
D
Q
 
Q
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
A
H
 
H
L
 
I
A
 
G
V
 
Q
T
 
A
A
 
W
D
 
K
L
 
A
I
 
I
A
 
Q
K
 
E
G
 
G
Y
 
V
P
 
P
M
 
L
R
 
K
G
 
G
Y
 
Y
F
 
F
A
 
V
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
|
F
G
 
G
I
 
I
V
 
V
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
S
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
V
K
 
K
K
 
D
S
 
S
G
 
G
R
 
Y
W
 
W
Y
 
Y
K
 
S
D
 
N
L
 
V
A
 
V
E
 
K

2wbgA Structure of family 1 beta-glucosidase from thermotoga maritima in complex with 3-imino-2-oxa-(+)-castanospermine (see paper)
46% identity, 96% coverage: 9:448/458 of query aligns to 1:438/443 of 2wbgA

query
sites
2wbgA
A
 
V
A
 
K
R
 
K
F
 
F
P
 
P
G
 
E
D
 
G
F
 
F
V
 
L
F
 
W
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
P
K
 
L
A
 
A
D
 
D
G
 
G
R
 
A
K
 
G
A
 
M
S
 
S
I
 
I
W
 
W
D
 
H
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
N
V
 
V
Y
 
K
G
 
N
R
 
G
H
 
D
N
 
T
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
K
Q
 
E
D
 
D
L
 
I
D
 
E
L
 
I
I
 
I
K
 
E
S
 
K
L
 
L
G
 
G
V
 
V
E
 
K
A
 
A
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
T
G
 
G
P
 
R
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
R
L
 
I
V
 
I
D
 
D
G
 
T
L
 
L
K
 
L
A
 
E
R
 
K
G
 
G
I
 
I
K
 
T
A
 
P
F
 
F
A
 
V
T
 
T
L
 
I
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
F
A
 
A
L
 
L
M
 
Q
G
 
L
D
 
K
G
 
G
G
 
G
W
 
W
T
 
A
A
 
N
R
 
R
T
 
E
T
 
I
A
 
A
Y
 
D
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
R
T
 
V
V
 
L
I
 
F
A
 
E
R
 
N
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
L
N
|
N
E
|
E
P
 
P
W
 
W
C
x
V
S
 
V
V
 
A
W
 
I
L
 
V
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
M
R
 
R
N
 
D
M
 
I
D
 
Y
A
 
V
A
 
A
L
 
F
A
 
R
A
 
A
L
 
V
H
 
H
F
 
N
T
 
L
N
 
L
L
 
R
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
V
I
 
F
R
 
R
S
 
E
E
 
T
R
 
V
P
 
K
E
 
D
L
 
G
P
 
K
V
 
I
G
 
G
I
 
I
V
 
V
I
 
F
N
 
N
A
 
N
H
 
G
S
 
Y
V
 
F
Y
 
E
P
 
P
G
 
A
S
 
S
N
 
E
S
 
K
A
 
E
E
 
E
D
 
D
K
 
I
A
 
R
A
 
A
A
 
V
E
 
R
R
 
F
A
 
M
F
 
H
D
 
Q
F
 
F
H
 
N
N
 
N
-
 
Y
G
 
P
V
 
L
F
 
F
F
 
L
D
 
N
P
 
P
I
 
I
F
 
Y
K
 
R
G
 
G
E
 
D
Y
 
Y
P
 
P
E
 
E
D
 
L
F
 
V
L
 
L
S
 
E
A
 
F
L
 
A
G
 
R
E
 
E
R
 
Y
M
 
L
P
 
P
A
 
E
I
 
N
E
 
Y
D
 
K
G
 
D
D
 
D
M
 
M
A
 
S
T
 
E
I
 
I
A
 
Q
Q
 
E
P
 
K
L
 
I
D
 
D
W
 
F
W
 
V
G
 
G
L
 
L
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
G
M
x
H
R
 
L
V
 
V
S
 
K
A
 
F
D
 
D
P
 
P
A
 
-
K
 
-
G
 
-
A
 
-
E
 
D
Y
 
A
P
 
P
A
 
A
T
 
K
V
 
V
N
 
S
A
 
F
K
 
V
P
 
E
V
 
R
S
 
D
N
 
L
V
 
P
K
 
K
T
 
T
D
 
A
I
 
M
G
 
G
W
|
W
E
 
E
V
 
I
Y
 
V
A
 
P
P
 
E
A
 
G
L
 
I
G
 
Y
S
 
W
L
 
I
V
 
L
E
 
K
T
 
K
L
 
V
N
 
K
A
 
E
R
 
E
Y
 
Y
R
 
N
L
 
P
P
 
P
D
 
E
C
 
V
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
A
Y
 
F
N
 
D
M
 
D
G
 
V
V
 
V
-
 
S
E
 
E
N
 
D
G
 
G
T
 
R
V
 
V
D
 
H
D
 
D
Q
 
Q
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
A
H
 
H
L
 
I
A
 
G
V
 
Q
T
 
A
A
 
W
D
 
K
L
 
A
I
 
I
A
 
Q
K
 
E
G
 
G
Y
 
V
P
 
P
M
 
L
R
 
K
G
 
G
Y
 
Y
F
 
F
A
 
V
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
 
F
G
 
G
I
 
I
V
 
V
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
S
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
V
K
 
K
K
 
D
S
 
S
G
 
G
R
 
Y
W
 
W
Y
 
Y
K
 
S
D
 
N
L
 
V
A
 
V
E
 
K

1oinA Family 1 b-glucosidase from thermotoga maritima (see paper)
46% identity, 96% coverage: 9:448/458 of query aligns to 2:437/442 of 1oinA

query
sites
1oinA
A
 
V
A
 
K
R
 
K
F
 
F
P
 
P
G
 
E
D
 
G
F
 
F
V
 
L
F
 
W
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
P
K
 
L
A
 
A
D
 
D
G
 
G
R
 
A
K
 
G
A
 
M
S
 
S
I
 
I
W
 
W
D
 
H
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
N
V
 
V
Y
 
K
G
 
N
R
 
G
H
 
D
N
 
T
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
K
Q
 
E
D
 
D
L
 
I
D
 
E
L
 
I
I
 
I
K
 
E
S
 
K
L
 
L
G
 
G
V
 
V
E
 
K
A
 
A
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
T
G
 
G
P
 
R
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
R
L
 
I
V
 
I
D
 
D
G
 
T
L
 
L
K
 
L
A
 
E
R
 
K
G
 
G
I
 
I
K
 
T
A
 
P
F
 
F
A
 
V
T
 
T
L
 
I
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
F
A
 
A
L
 
L
M
 
Q
G
 
L
D
 
K
G
 
G
G
 
G
W
 
W
T
 
A
A
 
N
R
 
R
T
 
E
T
 
I
A
 
A
Y
 
D
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
R
T
 
V
V
 
L
I
 
F
A
 
E
R
 
N
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
L
N
|
N
E
|
E
P
 
P
W
 
W
C
x
V
S
 
V
V
 
A
W
 
I
L
 
V
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
M
R
 
R
N
 
D
M
 
I
D
 
Y
A
 
V
A
 
A
L
 
F
A
 
R
A
 
A
L
 
V
H
 
H
F
 
N
T
 
L
N
 
L
L
 
R
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
V
I
 
F
R
 
R
S
 
E
E
 
T
R
 
V
P
 
K
E
 
D
L
 
G
P
 
K
V
 
I
G
 
G
I
 
I
V
 
V
I
 
F
N
 
N
A
 
N
H
 
G
S
 
Y
V
 
F
Y
 
E
P
 
P
G
 
A
S
 
S
N
 
E
S
 
K
A
 
E
E
 
E
D
 
D
K
 
I
A
 
R
A
 
A
A
 
V
E
 
R
R
 
F
A
 
M
F
 
H
D
 
Q
F
 
F
H
 
N
N
 
N
-
 
Y
G
 
P
V
 
L
F
 
F
F
 
L
D
 
N
P
 
P
I
 
I
F
 
Y
K
 
R
G
 
G
E
 
D
Y
 
Y
P
 
P
E
 
E
D
 
L
F
 
V
L
 
L
S
 
E
A
 
F
L
 
A
G
 
R
E
 
E
R
 
Y
M
 
L
P
 
P
A
 
E
I
 
N
E
 
Y
D
 
K
G
 
D
D
 
D
M
 
M
A
 
S
T
 
E
I
 
I
A
 
Q
Q
 
E
P
 
K
L
 
I
D
 
D
W
 
F
W
 
V
G
 
G
L
 
L
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
G
M
 
H
R
 
L
V
 
V
S
 
K
A
 
F
D
 
D
P
 
P
A
 
-
K
 
-
G
 
-
A
 
-
E
 
-
Y
 
-
P
 
P
A
 
A
T
 
K
V
 
V
N
 
S
A
 
F
K
 
V
P
 
E
V
 
R
S
 
D
N
 
L
V
 
P
K
 
K
T
 
T
D
 
A
I
 
M
G
 
G
W
 
W
E
 
E
V
 
I
Y
 
V
A
 
P
P
 
E
A
 
G
L
 
I
G
 
Y
S
 
W
L
 
I
V
 
L
E
 
K
T
 
K
L
 
V
N
 
K
A
 
E
R
 
E
Y
 
Y
R
 
N
L
 
P
P
 
P
D
 
E
C
 
V
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
A
Y
 
F
N
 
D
M
 
D
G
 
V
V
 
V
-
 
S
E
 
E
N
 
D
G
 
G
T
 
R
V
 
V
D
 
H
D
 
D
Q
 
Q
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
A
H
 
H
L
 
I
A
 
G
V
 
Q
T
 
A
A
 
W
D
 
K
L
 
A
I
 
I
A
 
Q
K
 
E
G
 
G
Y
 
V
P
 
P
M
 
L
R
 
K
G
 
G
Y
 
Y
F
 
F
A
 
V
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
 
F
G
 
G
I
 
I
V
 
V
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
S
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
V
K
 
K
K
 
D
S
 
S
G
 
G
R
 
Y
W
 
W
Y
 
Y
K
 
S
D
 
N
L
 
V
A
 
V
E
 
K

1oifA Family 1 b-glucosidase from thermotoga maritima (see paper)
46% identity, 96% coverage: 9:448/458 of query aligns to 1:438/444 of 1oifA

query
sites
1oifA
A
 
V
A
 
K
R
 
K
F
 
F
P
 
P
G
 
E
D
 
G
F
 
F
V
 
L
F
 
W
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
P
K
 
L
A
 
A
D
 
D
G
 
G
R
 
A
K
 
G
A
 
M
S
 
S
I
 
I
W
 
W
D
 
H
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
N
V
 
V
Y
 
K
G
 
N
R
 
G
H
 
D
N
 
T
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
K
Q
 
E
D
 
D
L
 
I
D
 
E
L
 
I
I
 
I
K
 
E
S
 
K
L
 
L
G
 
G
V
 
V
E
 
K
A
 
A
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
T
G
 
G
P
 
R
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
R
L
 
I
V
 
I
D
 
D
G
 
T
L
 
L
K
 
L
A
 
E
R
 
K
G
 
G
I
 
I
K
 
T
A
 
P
F
 
F
A
 
V
T
 
T
L
 
I
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
F
A
 
A
L
 
L
M
 
Q
G
 
L
D
 
K
G
 
G
G
 
G
W
 
W
T
 
A
A
 
N
R
 
R
T
 
E
T
 
I
A
 
A
Y
 
D
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
R
T
 
V
V
 
L
I
 
F
A
 
E
R
 
N
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
L
N
 
N
E
|
E
P
 
P
W
 
W
C
x
V
S
 
V
V
 
A
W
 
I
L
 
V
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
M
R
 
R
N
 
D
M
 
I
D
 
Y
A
 
V
A
 
A
L
 
F
A
 
R
A
 
A
L
 
V
H
 
H
F
 
N
T
 
L
N
 
L
L
 
R
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
V
I
 
F
R
 
R
S
 
E
E
 
T
R
 
V
P
 
K
E
 
D
L
 
G
P
 
K
V
 
I
G
 
G
I
 
I
V
 
V
I
 
F
N
 
N
A
 
N
H
 
G
S
 
Y
V
 
F
Y
 
E
P
 
P
G
 
A
S
 
S
N
 
E
S
 
K
A
 
E
E
 
E
D
 
D
K
 
I
A
 
R
A
 
A
A
 
V
E
 
R
R
 
F
A
 
M
F
 
H
D
 
Q
F
 
F
H
 
N
N
 
N
-
 
Y
G
 
P
V
 
L
F
 
F
F
 
L
D
 
N
P
 
P
I
 
I
F
 
Y
K
 
R
G
 
G
E
 
D
Y
 
Y
P
 
P
E
 
E
D
 
L
F
 
V
L
 
L
S
 
E
A
 
F
L
 
A
G
 
R
E
 
E
R
 
Y
M
 
L
P
 
P
A
 
E
I
 
N
E
 
Y
D
 
K
G
 
D
D
 
D
M
 
M
A
 
S
T
 
E
I
 
I
A
 
Q
Q
 
E
P
 
K
L
 
I
D
 
D
W
 
F
W
 
V
G
 
G
L
 
L
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
G
M
 
H
R
 
L
V
 
V
S
 
K
A
 
F
D
 
D
P
 
P
A
 
-
K
 
-
G
 
-
A
 
-
E
 
D
Y
 
A
P
 
P
A
 
A
T
 
K
V
 
V
N
 
S
A
 
F
K
 
V
P
 
E
V
 
R
S
 
D
N
 
L
V
 
P
K
 
K
T
 
T
D
 
A
I
 
M
G
 
G
W
 
W
E
 
E
V
 
I
Y
 
V
A
 
P
P
 
E
A
 
G
L
 
I
G
 
Y
S
 
W
L
 
I
V
 
L
E
 
K
T
 
K
L
 
V
N
 
K
A
 
E
R
 
E
Y
 
Y
R
 
N
L
 
P
P
 
P
D
 
E
C
 
V
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
A
Y
 
F
N
 
D
M
 
D
G
 
V
V
 
V
-
 
S
E
 
E
N
 
D
G
 
G
T
 
R
V
 
V
D
 
H
D
 
D
Q
 
Q
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
A
H
 
H
L
 
I
A
 
G
V
 
Q
T
 
A
A
 
W
D
 
K
L
 
A
I
 
I
A
 
Q
K
 
E
G
 
G
Y
 
V
P
 
P
M
 
L
R
 
K
G
 
G
Y
 
Y
F
 
F
A
 
V
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
|
F
G
 
G
I
 
I
V
 
V
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
S
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
V
K
 
K
K
 
D
S
 
S
G
 
G
R
 
Y
W
 
W
Y
 
Y
K
 
S
D
 
N
L
 
V
A
 
V
E
 
K

1w3jA Family 1 b-glucosidase from thermotoga maritima in complex with tetrahydrooxazine (see paper)
46% identity, 96% coverage: 11:448/458 of query aligns to 2:437/443 of 1w3jA

query
sites
1w3jA
R
 
K
F
 
F
P
 
P
G
 
E
D
 
G
F
 
F
V
 
L
F
 
W
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
P
K
 
L
A
 
A
D
 
D
G
 
G
R
 
A
K
 
G
A
 
M
S
 
S
I
 
I
W
 
W
D
 
H
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
N
V
 
V
Y
 
K
G
 
N
R
 
G
H
 
D
N
 
T
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
K
Q
 
E
D
 
D
L
 
I
D
 
E
L
 
I
I
 
I
K
 
E
S
 
K
L
 
L
G
 
G
V
 
V
E
 
K
A
 
A
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
T
G
 
G
P
 
R
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
R
L
 
I
V
 
I
D
 
D
G
 
T
L
 
L
K
 
L
A
 
E
R
 
K
G
 
G
I
 
I
K
 
T
A
 
P
F
 
F
A
 
V
T
 
T
L
 
I
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
F
A
 
A
L
 
L
M
 
Q
G
 
L
D
 
K
G
 
G
G
 
G
W
 
W
T
 
A
A
 
N
R
 
R
T
 
E
T
 
I
A
 
A
Y
 
D
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
R
T
 
V
V
 
L
I
 
F
A
 
E
R
 
N
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
L
N
 
N
E
|
E
P
 
P
W
 
W
C
x
V
S
 
V
V
 
A
W
 
I
L
 
V
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
M
R
 
R
N
 
D
M
 
I
D
 
Y
A
 
V
A
 
A
L
 
F
A
 
R
A
 
A
L
 
V
H
 
H
F
 
N
T
 
L
N
 
L
L
 
R
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
V
I
 
F
R
 
R
S
 
E
E
 
T
R
 
V
P
 
K
E
 
D
L
 
G
P
 
K
V
 
I
G
 
G
I
 
I
V
 
V
I
 
F
N
 
N
A
 
N
H
 
G
S
 
Y
V
 
F
Y
 
E
P
 
P
G
 
A
S
 
S
N
 
E
S
 
K
A
 
E
E
 
E
D
 
D
K
 
I
A
 
R
A
 
A
A
 
V
E
 
R
R
 
F
A
 
M
F
 
H
D
 
Q
F
 
F
H
 
N
N
 
N
-
 
Y
G
 
P
V
 
L
F
 
F
F
 
L
D
 
N
P
 
P
I
 
I
F
 
Y
K
 
R
G
 
G
E
 
D
Y
 
Y
P
 
P
E
 
E
D
 
L
F
 
V
L
 
L
S
 
E
A
 
F
L
 
A
G
 
R
E
 
E
R
 
Y
M
 
L
P
 
P
A
 
E
I
 
N
E
 
Y
D
 
K
G
 
D
D
 
D
M
 
M
A
 
S
T
 
E
I
 
I
A
 
Q
Q
 
E
P
 
K
L
 
I
D
 
D
W
 
F
W
 
V
G
 
G
L
 
L
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
G
M
 
H
R
 
L
V
 
V
S
 
K
A
 
F
D
 
D
P
 
P
A
 
-
K
 
-
G
 
-
A
 
-
E
 
D
Y
 
A
P
 
P
A
 
A
T
 
K
V
 
V
N
 
S
A
 
F
K
 
V
P
 
E
V
 
R
S
 
D
N
 
L
V
 
P
K
 
K
T
 
T
D
 
A
I
 
M
G
 
G
W
 
W
E
 
E
V
 
I
Y
 
V
A
 
P
P
 
E
A
 
G
L
 
I
G
 
Y
S
 
W
L
 
I
V
 
L
E
 
K
T
 
K
L
 
V
N
 
K
A
 
E
R
 
E
Y
 
Y
R
 
N
L
 
P
P
 
P
D
 
E
C
 
V
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
A
Y
 
F
N
 
D
M
 
D
G
 
V
V
 
V
-
 
S
E
 
E
N
 
D
G
 
G
T
 
R
V
 
V
D
 
H
D
 
D
Q
 
Q
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
A
H
 
H
L
 
I
A
 
G
V
 
Q
T
 
A
A
 
W
D
 
K
L
 
A
I
 
I
A
 
Q
K
 
E
G
 
G
Y
 
V
P
 
P
M
 
L
R
 
K
G
 
G
Y
 
Y
F
 
F
A
 
V
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
 
F
G
 
G
I
 
I
V
 
V
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
S
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
V
K
 
K
K
 
D
S
 
S
G
 
G
R
 
Y
W
 
W
Y
 
Y
K
 
S
D
 
N
L
 
V
A
 
V
E
 
K

2cesA Beta-glucosidase from thermotoga maritima in complex with glucoimidazole (see paper)
46% identity, 96% coverage: 9:448/458 of query aligns to 1:435/440 of 2cesA

query
sites
2cesA
A
 
V
A
 
K
R
 
K
F
 
F
P
 
P
G
 
E
D
 
G
F
 
F
V
 
L
F
 
W
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
P
K
 
L
A
 
A
D
 
D
G
 
G
R
 
A
K
 
G
A
 
M
S
 
S
I
 
I
W
 
W
D
 
H
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
N
V
 
V
Y
 
K
G
 
N
R
 
G
H
 
D
N
 
T
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
K
Q
 
E
D
 
D
L
 
I
D
 
E
L
 
I
I
 
I
K
 
E
S
 
K
L
 
L
G
 
G
V
 
V
E
 
K
A
 
A
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
T
G
 
G
P
 
R
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
R
L
 
I
V
 
I
D
 
D
G
 
T
L
 
L
K
 
L
A
 
E
R
 
K
G
 
G
I
 
I
K
 
T
A
 
P
F
 
F
A
 
V
T
 
T
L
 
I
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
F
A
 
A
L
 
L
M
 
Q
G
 
L
D
 
K
G
 
G
G
 
G
W
 
W
T
 
A
A
 
N
R
 
R
T
 
E
T
 
I
A
 
A
Y
 
D
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
R
T
 
V
V
 
L
I
 
F
A
 
E
R
 
N
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
L
N
|
N
E
|
E
P
 
P
W
 
W
C
x
V
S
 
V
V
 
A
W
 
I
L
 
V
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
M
R
 
R
N
 
D
M
 
I
D
 
Y
A
 
V
A
 
A
L
 
F
A
 
R
A
 
A
L
 
V
H
 
H
F
 
N
T
 
L
N
 
L
L
 
R
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
V
I
 
F
R
 
R
S
 
E
E
 
T
R
 
V
P
 
K
E
 
D
L
 
G
P
 
K
V
 
I
G
 
G
I
 
I
V
 
V
I
 
F
N
 
N
A
 
N
H
 
G
S
 
Y
V
 
F
Y
 
E
P
 
P
G
 
A
S
 
S
N
 
E
S
 
K
A
 
E
E
 
E
D
 
D
K
 
I
A
 
R
A
 
A
A
 
V
E
 
R
R
 
F
A
 
M
F
 
H
D
 
Q
F
 
F
H
 
N
N
 
N
-
 
Y
G
 
P
V
 
L
F
 
F
F
 
L
D
 
N
P
 
P
I
 
I
F
 
Y
K
 
R
G
 
G
E
 
D
Y
 
Y
P
 
P
E
 
E
D
 
L
F
 
V
L
 
L
S
 
E
A
 
F
L
 
A
G
 
R
E
 
E
R
 
Y
M
 
L
P
 
P
A
 
E
I
 
N
E
 
Y
D
 
K
G
 
D
D
 
D
M
 
M
A
 
S
T
 
E
I
 
I
A
 
Q
Q
 
E
P
 
K
L
 
I
D
 
D
W
 
F
W
 
V
G
 
G
L
 
L
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
G
M
 
H
R
 
L
V
 
V
S
 
K
A
 
F
D
 
D
P
 
P
A
 
A
K
 
K
G
 
-
A
 
-
E
 
-
Y
 
-
P
 
-
A
 
-
T
 
-
V
 
V
N
 
S
A
 
F
K
 
V
P
 
E
V
 
R
S
 
D
N
 
L
V
 
P
K
 
K
T
 
T
D
 
A
I
 
M
G
 
G
W
 
W
E
 
E
V
 
I
Y
 
V
A
 
P
P
 
E
A
 
G
L
 
I
G
 
Y
S
 
W
L
 
I
V
 
L
E
 
K
T
 
K
L
 
V
N
 
K
A
 
E
R
 
E
Y
 
Y
R
 
N
L
 
P
P
 
P
D
 
E
C
 
V
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
A
Y
 
F
N
 
D
M
 
D
G
 
V
V
 
V
-
 
S
E
 
E
N
 
D
G
 
G
T
 
R
V
 
V
D
 
H
D
 
D
Q
 
Q
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
A
H
 
H
L
 
I
A
 
G
V
 
Q
T
 
A
A
 
W
D
 
K
L
 
A
I
 
I
A
 
Q
K
 
E
G
 
G
Y
 
V
P
 
P
M
 
L
R
 
K
G
 
G
Y
 
Y
F
 
F
A
 
V
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
|
F
G
 
G
I
 
I
V
 
V
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
S
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
V
K
 
K
K
 
D
S
 
S
G
 
G
R
 
Y
W
 
W
Y
 
Y
K
 
S
D
 
N
L
 
V
A
 
V
E
 
K

1e4iA 2-deoxy-2-fluoro-beta-d-glucosyl/enzyme intermediate complex of the beta-glucosidase from bacillus polymyxa (see paper)
46% identity, 95% coverage: 11:447/458 of query aligns to 4:438/447 of 1e4iA

query
sites
1e4iA
R
 
Q
F
 
F
P
 
P
G
 
Q
D
 
D
F
 
F
V
 
M
F
 
W
G
 
G
V
 
T
A
 
A
T
 
T
A
 
A
S
 
A
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
A
S
 
Y
K
 
Q
A
 
E
D
 
D
G
 
G
R
 
R
K
 
G
A
 
L
S
 
S
I
 
I
W
 
W
D
 
D
A
 
T
F
 
F
S
 
A
N
 
H
M
 
T
P
 
P
G
 
G
R
 
K
V
 
V
Y
 
F
G
 
N
R
 
G
H
 
D
N
 
N
G
 
G
D
 
N
V
 
V
A
 
A
C
 
C
D
 
D
H
 
S
Y
 
Y
N
 
H
R
 
R
L
 
Y
E
 
E
Q
 
E
D
 
D
L
 
I
D
 
R
L
 
L
I
 
M
K
 
K
S
 
E
L
 
L
G
 
G
V
 
I
E
 
R
A
 
T
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
V
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
F
P
 
P
E
 
N
G
 
G
T
 
D
G
 
G
P
 
E
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
Y
Y
 
Y
D
 
H
R
 
R
L
 
V
V
 
V
D
 
D
G
 
L
L
 
L
K
 
N
A
 
D
R
 
N
G
 
G
I
 
I
K
 
E
A
 
P
F
 
F
A
 
C
T
 
T
L
 
L
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
Q
A
 
A
L
 
L
M
 
Q
G
 
D
D
 
A
G
 
G
G
 
G
W
 
W
T
 
G
A
 
N
R
|
R
T
 
R
T
 
T
A
 
I
Y
x
Q
A
 
A
Y
 
F
Q
x
V
R
 
Q
Y
 
F
A
 
A
K
 
E
T
 
T
V
 
M
I
 
F
A
 
R
R
 
E
L
 
F
G
 
H
D
 
G
R
 
K
L
 
I
D
 
Q
A
 
H
V
 
W
A
 
L
T
 
T
F
 
F
N
|
N
E
|
E
P
 
P
W
 
W
C
|
C
S
 
I
V
 
A
W
 
F
L
 
L
G
 
S
H
 
N
L
 
M
Y
 
L
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
L
R
 
T
N
 
N
M
 
L
D
 
Q
A
 
T
A
 
A
L
 
I
A
 
D
A
 
V
L
 
G
H
 
H
F
 
H
T
 
L
N
 
L
L
 
V
A
 
A
H
 
H
G
 
G
L
|
L
G
 
S
V
 
V
A
 
R
A
 
R
I
 
F
R
 
R
S
 
E
E
 
L
R
 
G
P
 
T
E
 
S
L
 
G
P
 
Q
V
 
I
G
 
G
I
 
I
V
 
A
I
 
P
N
 
N
A
 
V
H
 
S
S
 
W
V
 
A
Y
 
V
P
 
P
G
 
Y
S
 
S
N
 
T
S
 
S
A
 
E
E
 
E
D
 
D
K
 
K
A
 
A
A
 
A
A
 
C
E
 
A
R
 
R
A
 
T
F
 
I
D
 
S
F
 
L
H
 
H
N
 
S
G
 
D
V
 
W
F
 
F
F
 
L
D
 
Q
P
 
P
I
 
I
F
 
Y
K
 
Q
G
 
G
E
 
S
Y
 
Y
P
 
P
E
 
Q
-
 
F
-
 
L
-
 
V
D
 
D
F
 
W
L
 
F
S
 
A
A
 
E
L
 
Q
G
 
G
E
 
A
R
 
T
M
 
V
P
 
P
A
 
-
I
 
I
E
 
Q
D
 
D
G
 
G
D
 
D
M
 
M
A
 
D
T
 
I
I
 
I
A
 
G
Q
 
E
P
 
P
L
 
I
D
 
D
W
 
M
W
 
I
G
 
G
L
 
I
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
M
M
 
S
R
 
V
V
 
N
S
 
R
A
 
F
D
 
N
P
 
P
A
 
E
K
 
A
G
 
G
A
 
F
E
 
L
Y
 
Q
P
 
S
A
 
E
T
 
E
V
 
I
N
 
N
-
 
M
A
 
G
K
 
L
P
 
P
V
 
V
S
 
-
N
 
-
V
 
-
K
 
-
T
 
T
D
 
D
I
 
I
G
 
G
W
 
W
E
 
P
V
 
V
Y
 
E
A
 
S
P
 
R
A
 
G
L
 
L
G
 
Y
S
 
E
L
 
V
V
 
L
E
 
H
T
 
Y
L
 
L
N
 
Q
A
 
-
R
 
K
Y
 
Y
R
 
G
L
 
N
P
 
I
D
 
D
C
 
I
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
C
Y
 
I
N
 
N
M
 
D
G
 
E
V
 
V
E
 
V
N
 
N
G
 
G
T
 
K
V
 
V
D
 
Q
D
 
D
Q
 
D
P
 
R
R
 
R
L
 
I
D
 
S
Y
 
Y
I
 
M
S
 
Q
D
 
Q
H
 
H
L
 
L
A
 
V
V
 
Q
T
 
V
A
 
H
D
 
R
L
 
T
I
 
I
A
 
H
K
 
D
G
 
G
Y
 
L
P
 
H
M
 
V
R
 
K
G
 
G
Y
 
Y
F
 
M
A
 
A
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
N
M
 
M
R
 
R
F
 
F
G
 
G
I
 
M
V
 
I
H
 
H
V
 
V
D
 
D
Y
 
F
E
 
R
T
 
T
Q
 
Q
V
 
V
R
 
R
T
 
T
I
 
P
K
 
K
K
 
Q
S
 
S
G
 
Y
R
 
Y
W
 
W
Y
 
Y
K
 
R
D
 
N
L
 
V
A
 
V

6r4kA Structure of beta-glucosidase a from paenibacillus polymyxa complexed with a monovalent inhibitor (see paper)
46% identity, 95% coverage: 11:447/458 of query aligns to 5:439/448 of 6r4kA

query
sites
6r4kA
R
 
Q
F
 
F
P
 
P
G
 
Q
D
 
D
F
 
F
V
 
M
F
 
W
G
 
G
V
 
T
A
 
A
T
 
T
A
 
A
S
 
A
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
A
S
 
Y
K
 
Q
A
 
E
D
 
D
G
 
G
R
 
R
K
 
G
A
 
L
S
 
S
I
 
I
W
 
W
D
 
D
A
 
T
F
 
F
S
 
A
N
 
H
M
 
T
P
 
P
G
 
G
R
 
K
V
 
V
Y
 
F
G
 
N
R
 
G
H
 
D
N
 
N
G
 
G
D
 
N
V
 
V
A
 
A
C
 
C
D
 
D
H
 
S
Y
 
Y
N
 
H
R
 
R
L
 
Y
E
 
E
Q
 
E
D
 
D
L
 
I
D
 
R
L
 
L
I
 
M
K
 
K
S
 
E
L
 
L
G
 
G
V
 
I
E
 
R
A
 
T
Y
 
Y
R
 
R
F
 
F
S
 
S
I
 
V
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
F
P
 
P
E
 
N
G
 
G
T
 
D
G
 
G
P
 
E
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
Y
Y
 
Y
D
 
H
R
 
R
L
 
V
V
 
V
D
 
D
G
 
L
L
 
L
K
 
N
A
 
D
R
 
N
G
 
G
I
 
I
K
 
E
A
 
P
F
 
F
A
 
C
T
 
T
L
 
L
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
Q
A
 
A
L
 
L
M
 
Q
G
 
D
D
 
A
G
 
G
G
 
G
W
 
W
T
 
G
A
 
N
R
 
R
T
 
R
T
 
T
A
 
I
Y
 
Q
A
 
A
Y
 
F
Q
 
V
R
 
Q
Y
 
F
A
 
A
K
 
E
T
 
T
V
 
M
I
 
F
A
 
R
R
 
E
L
 
F
G
 
H
D
 
G
R
 
K
L
 
I
D
 
Q
A
 
H
V
 
W
A
 
L
T
 
T
F
 
F
N
 
N
E
|
E
P
 
P
W
 
W
C
 
C
S
 
I
V
 
A
W
 
F
L
|
L
G
 
S
H
 
N
L
 
M
Y
 
L
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
L
R
 
T
N
 
N
M
 
L
D
 
Q
A
 
T
A
 
A
L
 
I
A
 
D
A
 
V
L
 
G
H
 
H
F
 
H
T
 
L
N
 
L
L
 
V
A
 
A
H
 
H
G
 
G
L
 
L
G
 
S
V
 
V
A
 
R
A
 
R
I
 
F
R
 
R
S
 
E
E
 
L
R
 
G
P
 
T
E
 
S
L
 
G
P
 
Q
V
 
I
G
 
G
I
 
I
V
 
A
I
 
P
N
 
N
A
 
V
H
 
S
S
 
W
V
 
A
Y
 
V
P
 
P
G
 
Y
S
 
S
N
 
T
S
 
S
A
 
E
E
 
E
D
 
D
K
 
K
A
 
A
A
 
A
A
 
C
E
 
A
R
 
R
A
 
T
F
 
I
D
 
S
F
 
L
H
 
H
N
 
S
G
 
D
V
 
W
F
 
F
F
 
L
D
 
Q
P
 
P
I
 
I
F
 
Y
K
 
Q
G
 
G
E
 
S
Y
 
Y
P
 
P
E
 
Q
-
 
F
-
 
L
-
 
V
D
 
D
F
 
W
L
 
F
S
 
A
A
 
E
L
 
Q
G
 
G
E
 
A
R
 
T
M
 
V
P
 
P
A
 
-
I
 
I
E
 
Q
D
 
D
G
 
G
D
 
D
M
 
M
A
 
D
T
 
I
I
 
I
A
 
G
Q
 
E
P
 
P
L
 
I
D
 
D
W
 
M
W
 
I
G
 
G
L
 
I
N
 
N
Y
 
Y
Y
 
Y
T
 
S
P
 
M
M
 
S
R
 
V
V
 
N
S
 
R
A
 
F
D
 
N
P
 
P
A
 
E
K
 
A
G
 
G
A
 
F
E
 
L
Y
 
Q
P
 
S
A
 
E
T
 
E
V
 
I
N
 
N
-
 
M
A
 
G
K
 
L
P
 
P
V
 
V
S
 
-
N
 
-
V
 
-
K
 
-
T
 
T
D
 
D
I
 
I
G
 
G
W
 
W
E
 
P
V
 
V
Y
 
E
A
 
S
P
 
R
A
 
G
L
 
L
G
 
Y
S
 
E
L
 
V
V
 
L
E
 
H
T
 
Y
L
 
L
N
 
Q
A
 
-
R
 
K
Y
 
Y
R
 
G
L
 
N
P
 
I
D
 
D
C
 
I
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
C
Y
 
I
N
 
N
M
 
D
G
 
E
V
 
V
E
 
V
N
 
N
G
 
G
T
 
K
V
 
V
D
 
Q
D
 
D
Q
 
D
P
 
R
R
 
R
L
 
I
D
 
S
Y
 
Y
I
 
M
S
 
Q
D
 
Q
H
 
H
L
 
L
A
 
V
V
 
Q
T
 
V
A
 
H
D
 
R
L
 
A
I
 
I
A
 
H
K
 
D
G
 
G
Y
 
L
P
 
H
M
 
V
R
 
K
G
 
G
Y
 
Y
F
 
M
A
 
A
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
M
R
 
R
F
 
F
G
 
G
I
 
I
V
 
I
H
 
H
V
 
V
D
 
D
Y
 
F
E
 
R
T
 
T
Q
 
Q
V
 
V
R
 
R
T
 
T
I
 
P
K
 
K
K
 
E
S
 
S
G
 
Y
R
 
Y
W
 
W
Y
 
Y
K
 
R
D
 
K
L
 
V
A
 
V

6qwiA Structure of beta-glucosidase a from paenibacillus polymyxa complexed with multivalent inhibitors. (see paper)
46% identity, 95% coverage: 11:447/458 of query aligns to 5:439/448 of 6qwiA

query
sites
6qwiA
R
 
Q
F
 
F
P
 
P
G
 
Q
D
 
D
F
 
F
V
 
M
F
 
W
G
 
G
V
 
T
A
 
A
T
 
T
A
 
A
S
 
A
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
A
S
 
Y
K
 
Q
A
 
E
D
 
D
G
 
G
R
 
R
K
 
G
A
 
L
S
 
S
I
 
I
W
 
W
D
 
D
A
 
T
F
 
F
S
 
A
N
 
H
M
 
T
P
 
P
G
 
G
R
 
K
V
 
V
Y
 
F
G
 
N
R
 
G
H
 
D
N
 
N
G
 
G
D
 
N
V
 
V
A
 
A
C
 
C
D
 
D
H
 
S
Y
 
Y
N
 
H
R
 
R
L
 
Y
E
 
E
Q
 
E
D
 
D
L
 
I
D
 
R
L
 
L
I
 
M
K
 
K
S
 
E
L
 
L
G
 
G
V
 
I
E
 
R
A
 
T
Y
 
Y
R
 
R
F
 
F
S
 
S
I
 
V
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
F
P
 
P
E
 
N
G
 
G
T
 
D
G
 
G
P
 
E
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
Y
Y
 
Y
D
 
H
R
 
R
L
 
V
V
 
V
D
 
D
G
 
L
L
 
L
K
 
N
A
 
D
R
 
N
G
 
G
I
 
I
K
 
E
A
 
P
F
 
F
A
 
C
T
 
T
L
 
L
Y
 
Y
H
|
H
W
|
W
D
 
D
L
 
L
P
 
P
L
 
Q
A
 
A
L
 
L
M
 
Q
G
 
D
D
 
A
G
 
G
G
 
G
W
 
W
T
 
G
A
 
N
R
 
R
T
 
R
T
 
T
A
 
I
Y
 
Q
A
 
A
Y
 
F
Q
 
V
R
 
Q
Y
 
F
A
 
A
K
 
E
T
 
T
V
 
M
I
 
F
A
 
R
R
 
E
L
 
F
G
 
H
D
 
G
R
 
K
L
 
I
D
 
Q
A
 
H
V
 
W
A
 
L
T
 
T
F
 
F
N
 
N
E
|
E
P
 
P
W
 
W
C
 
C
S
 
I
V
 
A
W
 
F
L
|
L
G
 
S
H
 
N
L
 
M
Y
 
L
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
L
R
 
T
N
 
N
M
 
L
D
 
Q
A
 
T
A
 
A
L
 
I
A
 
D
A
 
V
L
 
G
H
 
H
F
 
H
T
 
L
N
 
L
L
 
V
A
 
A
H
 
H
G
 
G
L
 
L
G
 
S
V
 
V
A
 
R
A
 
R
I
 
F
R
 
R
S
 
E
E
 
L
R
 
G
P
 
T
E
 
S
L
 
G
P
 
Q
V
 
I
G
 
G
I
 
I
V
 
A
I
 
P
N
 
N
A
 
V
H
 
S
S
 
W
V
 
A
Y
 
V
P
 
P
G
 
Y
S
 
S
N
 
T
S
 
S
A
 
E
E
 
E
D
 
D
K
 
K
A
 
A
A
 
A
A
 
C
E
 
A
R
 
R
A
 
T
F
 
I
D
 
S
F
 
L
H
 
H
N
 
S
G
 
D
V
 
W
F
 
F
F
 
L
D
 
Q
P
 
P
I
 
I
F
 
Y
K
 
Q
G
 
G
E
 
S
Y
 
Y
P
 
P
E
 
Q
-
 
F
-
 
L
-
 
V
D
 
D
F
 
W
L
 
F
S
 
A
A
 
E
L
 
Q
G
 
G
E
 
A
R
 
T
M
 
V
P
 
P
A
 
-
I
 
I
E
 
Q
D
 
D
G
 
G
D
 
D
M
 
M
A
 
D
T
 
I
I
 
I
A
 
G
Q
 
E
P
 
P
L
 
I
D
 
D
W
 
M
W
 
I
G
 
G
L
 
I
N
 
N
Y
 
Y
Y
 
Y
T
 
S
P
 
M
M
 
S
R
 
V
V
 
N
S
 
R
A
 
F
D
 
N
P
 
P
A
 
E
K
 
A
G
 
G
A
 
F
E
 
L
Y
 
Q
P
 
S
A
 
E
T
 
E
V
 
I
N
 
N
-
 
M
A
 
G
K
 
L
P
 
P
V
 
V
S
 
-
N
 
-
V
 
-
K
 
-
T
 
T
D
 
D
I
 
I
G
 
G
W
|
W
E
 
P
V
 
V
Y
 
E
A
 
S
P
 
R
A
 
G
L
 
L
G
 
Y
S
 
E
L
 
V
V
 
L
E
 
H
T
 
Y
L
 
L
N
 
Q
A
 
-
R
 
K
Y
 
Y
R
 
G
L
 
N
P
 
I
D
 
D
C
 
I
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
C
Y
 
I
N
 
N
M
 
D
G
 
E
V
 
V
E
 
V
N
 
N
G
 
G
T
 
K
V
 
V
D
 
Q
D
 
D
Q
 
D
P
 
R
R
 
R
L
 
I
D
 
S
Y
 
Y
I
 
M
S
 
Q
D
 
Q
H
 
H
L
 
L
A
 
V
V
 
Q
T
 
V
A
 
H
D
 
R
L
 
A
I
 
I
A
 
H
K
 
D
G
 
G
Y
 
L
P
 
H
M
 
V
R
 
K
G
 
G
Y
 
Y
F
 
M
A
 
A
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
M
R
 
R
F
 
F
G
 
G
I
 
I
V
 
I
H
 
H
V
 
V
D
 
D
Y
 
F
E
 
R
T
 
T
Q
 
Q
V
 
V
R
 
R
T
 
T
I
 
P
K
 
K
K
 
E
S
 
S
G
 
Y
R
 
Y
W
 
W
Y
 
Y
K
 
R
D
 
K
L
 
V
A
 
V

2wc3A Structure of family 1 beta-glucosidase from thermotoga maritima in complex with 3-imino-2-oxa-(+)-8-epi-castanospermine (see paper)
45% identity, 96% coverage: 9:448/458 of query aligns to 2:437/442 of 2wc3A

query
sites
2wc3A
A
 
V
A
 
K
R
 
K
F
 
F
P
 
P
G
 
E
D
 
G
F
 
F
V
 
L
F
 
W
G
 
G
V
 
V
A
 
A
T
 
T
A
 
A
S
 
S
F
 
Y
Q
|
Q
I
 
I
E
 
E
G
 
G
A
 
S
S
 
P
K
 
L
A
 
A
D
 
D
G
 
G
R
 
A
K
 
G
A
 
M
S
 
S
I
 
I
W
 
W
D
 
H
A
 
T
F
 
F
S
 
S
N
 
H
M
 
T
P
 
P
G
 
G
R
 
N
V
 
V
Y
 
K
G
 
N
R
 
G
H
 
D
N
 
T
G
 
G
D
 
D
V
 
V
A
 
A
C
 
C
D
 
D
H
 
H
Y
 
Y
N
 
N
R
 
R
L
 
W
E
 
K
Q
 
E
D
 
D
L
 
I
D
 
E
L
 
I
I
 
I
K
 
E
S
 
K
L
 
L
G
 
G
V
 
V
E
 
K
A
 
A
Y
 
Y
R
|
R
F
 
F
S
 
S
I
 
I
A
 
S
W
 
W
P
 
P
R
 
R
I
 
I
V
 
L
P
 
P
E
 
E
G
 
G
T
 
T
G
 
G
P
 
R
I
 
V
N
 
N
E
 
Q
K
 
K
G
 
G
L
 
L
D
 
D
F
 
F
Y
 
Y
D
 
N
R
 
R
L
 
I
V
 
I
D
 
D
G
 
T
L
 
L
K
 
L
A
 
E
R
 
K
G
 
G
I
 
I
K
 
T
A
 
P
F
 
F
A
 
V
T
 
T
L
 
I
Y
 
Y
H
|
H
W
 
W
D
 
D
L
 
L
P
 
P
L
 
F
A
 
A
L
 
L
M
 
Q
G
 
L
D
 
K
G
 
G
G
 
G
W
 
W
T
 
A
A
 
N
R
 
R
T
 
E
T
 
I
A
 
A
Y
 
D
A
 
W
Y
 
F
Q
 
A
R
 
E
Y
 
Y
A
 
S
K
 
R
T
 
V
V
 
L
I
 
F
A
 
E
R
 
N
L
 
F
G
 
G
D
 
D
R
 
R
L
 
V
D
 
K
A
 
N
V
 
W
A
 
I
T
 
T
F
 
L
N
|
N
E
|
E
P
 
P
W
 
W
C
x
V
S
 
V
V
 
A
W
 
I
L
 
V
G
 
G
H
 
H
L
 
L
Y
 
Y
G
 
G
V
 
V
H
 
H
A
 
A
P
 
P
G
 
G
E
 
M
R
 
R
N
 
D
M
 
I
D
 
Y
A
 
V
A
 
A
L
 
F
A
 
R
A
 
A
L
 
V
H
 
H
F
 
N
T
 
L
N
 
L
L
 
R
A
 
A
H
 
H
G
 
A
L
 
R
G
 
A
V
 
V
A
 
K
A
 
V
I
 
F
R
 
R
S
 
E
E
 
T
R
 
V
P
 
K
E
 
D
L
 
G
P
 
K
V
 
I
G
 
G
I
 
I
V
 
V
I
 
F
N
 
N
A
 
N
H
 
G
S
 
Y
V
 
F
Y
 
E
P
 
P
G
 
A
S
 
S
N
 
E
S
 
K
A
 
E
E
 
E
D
 
D
K
 
I
A
 
R
A
 
A
A
 
V
E
 
R
R
 
F
A
 
M
F
 
H
D
 
Q
F
 
F
H
 
N
N
 
N
-
 
Y
G
 
P
V
 
L
F
 
F
F
 
L
D
 
N
P
 
P
I
 
I
F
 
Y
K
 
R
G
 
G
E
 
D
Y
 
Y
P
 
P
E
 
E
D
 
L
F
 
V
L
 
L
S
 
E
A
 
F
L
 
A
G
 
R
E
 
E
R
 
Y
M
 
L
P
 
P
A
 
E
I
 
N
E
 
Y
D
 
K
G
 
D
D
 
D
M
 
M
A
 
S
T
 
E
I
 
I
A
 
Q
Q
 
E
P
 
K
L
 
I
D
 
D
W
 
F
W
 
V
G
 
G
L
 
L
N
|
N
Y
 
Y
Y
|
Y
T
 
S
P
 
G
M
x
H
R
 
L
V
 
V
S
 
K
A
 
F
D
 
D
P
 
P
A
 
-
K
 
-
G
 
-
A
 
-
E
 
-
Y
 
-
P
 
D
A
 
A
T
 
K
V
 
V
N
 
S
A
 
F
K
 
V
P
 
E
V
 
R
S
 
D
N
 
L
V
 
P
K
 
K
T
 
T
D
 
A
I
 
M
G
 
G
W
|
W
E
 
E
V
 
I
Y
 
V
A
 
P
P
 
E
A
 
G
L
 
I
G
 
Y
S
 
W
L
 
I
V
 
L
E
 
K
T
 
K
L
 
V
N
 
K
A
 
E
R
 
E
Y
 
Y
R
 
N
L
 
P
P
 
P
D
 
E
C
 
V
Y
 
Y
I
 
I
T
 
T
E
|
E
N
 
N
G
 
G
A
 
A
C
 
A
Y
 
F
N
 
D
M
 
D
G
 
V
V
 
V
-
 
S
E
 
E
N
 
D
G
 
G
T
 
R
V
 
V
D
 
H
D
 
D
Q
 
Q
P
 
N
R
 
R
L
 
I
D
 
D
Y
 
Y
I
 
L
S
 
K
D
 
A
H
 
H
L
 
I
A
 
G
V
 
Q
T
 
A
A
 
W
D
 
K
L
 
A
I
 
I
A
 
Q
K
 
E
G
 
G
Y
 
V
P
 
P
M
 
L
R
 
K
G
 
G
Y
 
Y
F
 
F
A
 
V
W
|
W
S
 
S
L
 
L
M
 
L
D
 
D
N
 
N
F
 
F
E
|
E
W
|
W
A
 
A
E
 
E
G
 
G
Y
 
Y
R
 
S
M
 
K
R
 
R
F
|
F
G
 
G
I
 
I
V
 
V
H
 
Y
V
 
V
D
 
D
Y
 
Y
E
 
S
T
 
T
Q
 
Q
V
 
K
R
 
R
T
 
I
I
 
V
K
 
K
K
 
D
S
 
S
G
 
G
R
 
Y
W
 
W
Y
 
Y
K
 
S
D
 
N
L
 
V
A
 
V
E
 
K

Query Sequence

>SMc03160 FitnessBrowser__Smeli:SMc03160
MMIEAKKLAARFPGDFVFGVATASFQIEGASKADGRKASIWDAFSNMPGRVYGRHNGDVA
CDHYNRLEQDLDLIKSLGVEAYRFSIAWPRIVPEGTGPINEKGLDFYDRLVDGLKARGIK
AFATLYHWDLPLALMGDGGWTARTTAYAYQRYAKTVIARLGDRLDAVATFNEPWCSVWLG
HLYGVHAPGERNMDAALAALHFTNLAHGLGVAAIRSERPELPVGIVINAHSVYPGSNSAE
DKAAAERAFDFHNGVFFDPIFKGEYPEDFLSALGERMPAIEDGDMATIAQPLDWWGLNYY
TPMRVSADPAKGAEYPATVNAKPVSNVKTDIGWEVYAPALGSLVETLNARYRLPDCYITE
NGACYNMGVENGTVDDQPRLDYISDHLAVTADLIAKGYPMRGYFAWSLMDNFEWAEGYRM
RFGIVHVDYETQVRTIKKSGRWYKDLAERFPSGNHKPG

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory