SitesBLAST – Find functional sites

 

SitesBLAST

Comparing GFF4325 FitnessBrowser__WCS417:GFF4325 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 4 hits to proteins with known functional sites (download)

P32140 Sulfoquinovose isomerase; SQ isomerase; Sulfoquinovose-sulfofructose isomerase; SQ-SF isomerase; EC 5.3.1.31 from Escherichia coli (strain K12) (see paper)
47% identity, 96% coverage: 10:413/419 of query aligns to 2:406/413 of P32140

query
sites
P32140
S
 
K
W
 
W
L
 
F
N
 
N
A
 
T
P
 
L
A
 
S
H
 
H
Y
 
N
V
 
R
W
 
W
L
 
L
A
 
E
A
 
Q
E
 
E
G
 
T
Q
 
D
R
 
R
L
 
I
L
 
F
A
 
D
F
 
F
A
 
G
K
 
K
A
 
N
S
 
S
R
 
V
L
 
V
P
 
P
D
 
T
G
 
G
F
 
F
G
 
G
N
 
W
L
 
L
D
 
G
D
 
N
K
 
K
G
 
G
Q
 
Q
L
 
I
P
 
K
A
 
E
D
 
E
A
 
M
H
 
G
A
 
T
E
 
H
T
 
L
M
 
W
N
 
I
T
 
T
A
 
A
R
|
R
M
 
M
T
 
L
H
 
H
S
 
V
F
 
Y
A
 
S
M
 
V
A
 
A
H
 
A
A
 
A
L
 
M
G
 
G
L
 
R
P
 
P
G
 
G
Y
 
A
A
 
Y
E
 
S
L
 
L
V
 
V
A
 
D
H
 
H
G
 
G
V
 
I
A
 
K
A
 
A
L
 
M
S
 
N
G
 
G
A
 
A
L
 
L
R
 
R
D
 
D
S
 
K
E
 
K
H
 
Y
G
 
G
G
 
G
W
 
W
F
 
Y
A
 
A
A
 
C
P
 
V
H
 
N
-
 
D
-
 
E
-
 
G
A
 
V
L
 
V
D
 
D
G
 
A
N
 
S
R
 
-
G
 
-
K
 
K
A
 
Q
A
 
G
Y
 
Y
L
 
Q
H
 
H
A
 
F
F
 
F
V
 
A
A
 
L
L
 
L
A
 
G
A
 
A
S
 
A
S
 
S
A
 
A
V
 
V
V
 
T
A
 
T
G
 
G
A
 
H
P
 
P
G
 
E
A
 
A
S
 
R
T
 
K
L
 
L
L
 
L
N
 
D
D
 
Y
A
 
T
I
 
I
H
 
E
I
 
I
I
 
I
D
 
E
H
 
K
F
 
Y
F
 
F
W
 
W
S
 
S
E
 
E
E
 
E
E
 
E
G
 
Q
V
 
M
M
 
C
L
 
L
E
 
E
S
 
S
F
 
W
A
 
D
Q
 
E
D
 
A
W
 
F
S
 
S
G
 
K
V
 
T
E
 
E
A
 
E
Y
 
Y
R
 
R
G
 
G
A
 
G
N
 
N
S
 
A
N
 
N
M
 
M
H
|
H
A
 
A
T
 
V
E
 
E
A
 
A
F
 
F
L
 
L
A
 
I
L
 
V
A
 
Y
D
 
D
V
 
V
T
 
T
G
 
H
D
 
D
T
 
K
R
 
K
W
 
W
L
 
L
D
 
D
R
 
R
A
 
A
L
 
I
R
 
R
I
 
V
V
 
A
E
 
S
R
 
V
V
 
I
I
 
I
H
 
H
T
 
D
H
 
V
A
 
A
A
 
R
G
 
N
N
 
N
Q
 
H
F
 
Y
M
 
R
V
 
V
I
 
N
E
 
E
H
 
H
F
 
F
D
 
D
T
 
T
H
 
Q
W
 
W
H
 
N
P
 
P
L
 
L
L
 
P
G
 
D
Y
 
Y
N
 
N
E
 
K
D
 
D
N
 
N
P
 
P
A
 
A
D
 
H
G
 
R
F
 
F
R
 
R
P
 
A
Y
 
F
G
 
G
I
 
G
T
 
T
P
 
P
G
 
G
H
|
H
G
 
W
F
 
I
E
|
E
W
 
W
A
 
G
R
 
R
L
 
L
V
 
M
L
 
L
H
 
H
L
 
I
E
 
H
A
 
A
A
 
A
R
 
L
L
 
E
Q
 
A
A
 
R
G
 
C
L
 
E
V
 
Q
T
 
P
P
 
P
E
 
A
W
 
W
L
 
L
V
 
L
A
 
E
D
 
D
A
 
A
K
 
K
R
 
G
L
 
L
F
 
F
A
 
N
S
 
A
A
 
T
C
 
V
E
 
R
Y
 
D
A
 
A
W
 
W
S
 
A
V
 
P
D
 
D
G
 
G
A
 
A
P
 
D
G
 
G
I
 
I
V
 
V
Y
 
Y
T
 
T
L
 
V
D
 
D
W
 
W
N
 
E
H
 
G
R
 
K
P
 
P
V
 
V
V
 
V
R
 
R
E
 
E
R
 
R
L
 
V
H
 
R
W
 
W
T
 
P
H
 
I
A
 
V
E
|
E
A
 
A
S
 
M
A
 
G
A
 
T
A
 
A
Q
 
Y
A
 
A
L
 
L
L
 
Y
K
 
T
R
 
V
T
 
T
G
 
G
E
 
D
L
 
R
H
 
Q
Y
 
Y
E
 
E
T
 
T
W
 
W
Y
 
Y
R
 
Q
R
 
T
F
 
W
W
 
W
E
 
E
F
 
Y
C
 
C
E
 
I
T
 
K
H
 
Y
F
 
L
I
 
M
D
 
D
R
 
Y
L
 
E
H
 
N
G
 
G
S
 
S
W
 
W
H
 
W
H
 
Q
E
 
E
L
 
L
S
 
D
P
 
A
H
 
D
N
 
N
Q
 
K
P
 
V
S
 
T
S
 
T
N
 
K
I
 
V
W
 
W
G
 
D
G
 
G
K
 
K
P
 
Q
D
 
D
L
 
I
Y
 
Y
H
|
H
A
 
L
W
 
L
Q
 
H
A
 
C
V
 
L
L
 
V
L
 
I
P
 
P
A
 
R
L
 
I
P
 
P
L
 
L
A
 
A
P
 
P
S
 
G
M
 
M
A
 
A
S
 
P
A
 
A
I
 
V
G
 
A
T
 
A
G
 
G

7ag4D Crystal structure of active site mutant of sq isomerase (yihs-h248a) from salmonella enterica in complex with sulfofructose (sf) (see paper)
45% identity, 96% coverage: 10:413/419 of query aligns to 14:418/425 of 7ag4D

query
sites
7ag4D
S
 
K
W
 
W
L
 
F
N
 
N
A
 
T
P
 
L
A
 
S
H
 
H
Y
 
N
V
 
R
W
 
W
L
 
L
A
 
E
A
 
Q
E
 
E
G
 
T
Q
 
D
R
 
R
L
 
I
L
 
F
A
 
N
F
 
F
A
 
G
K
 
K
A
 
N
S
 
A
R
 
V
L
 
V
P
 
P
D
 
T
G
 
G
F
 
F
G
 
G
N
 
W
L
 
L
D
 
G
D
 
N
K
 
K
G
 
G
Q
 
Q
L
 
I
P
 
K
A
 
E
D
 
E
A
 
M
H
 
G
A
 
T
E
 
H
T
 
L
M
x
W
N
 
I
T
 
T
A
 
A
R
|
R
M
 
M
T
 
L
H
 
H
S
 
V
F
 
Y
A
 
S
M
 
V
A
 
A
H
 
A
A
 
S
L
 
M
G
 
G
L
 
R
P
 
P
G
 
G
Y
 
A
A
 
Y
E
 
D
L
 
L
V
 
V
A
 
D
H
 
H
G
 
G
V
 
I
A
 
K
A
 
A
L
 
M
S
 
N
G
 
G
A
 
A
L
 
L
R
 
R
D
 
D
S
 
K
E
 
K
H
 
Y
G
 
G
G
 
G
W
 
W
F
 
Y
A
 
A
A
 
C
P
 
V
H
 
N
-
 
D
-
 
Q
-
 
G
A
 
V
L
 
V
D
 
D
G
 
A
N
 
S
R
 
-
G
 
-
K
 
K
A
 
Q
A
 
G
Y
|
Y
L
 
Q
H
 
H
A
 
F
F
 
F
V
 
A
A
 
L
L
 
L
A
 
G
A
 
A
S
 
A
S
 
S
A
 
A
V
 
V
V
 
T
A
 
T
G
 
G
A
 
H
P
 
P
G
 
E
A
 
A
S
 
R
T
 
K
L
 
L
L
 
L
N
 
D
D
 
Y
A
 
T
I
 
I
H
 
E
I
 
V
I
 
I
D
 
E
H
 
K
F
 
Y
F
 
F
W
 
W
S
 
S
E
 
E
E
 
E
E
 
E
G
 
Q
V
 
M
M
 
C
L
 
L
E
 
E
S
 
S
F
 
W
A
 
D
Q
 
E
D
 
A
W
 
F
S
 
S
G
 
Q
V
 
T
E
 
E
A
 
D
Y
 
Y
R
 
R
G
 
G
A
 
G
N
|
N
S
 
A
N
 
N
M
 
M
H
|
H
A
 
A
T
 
V
E
 
E
A
 
A
F
 
F
L
 
L
A
 
I
L
 
V
A
 
Y
D
 
D
V
 
V
T
 
T
G
 
H
D
 
D
T
 
K
R
 
K
W
 
W
L
 
L
D
 
D
R
 
R
A
 
A
L
 
L
R
 
R
I
 
I
V
 
A
E
 
S
R
 
V
V
 
I
I
 
I
H
 
H
T
 
D
H
 
V
A
 
A
A
 
R
G
 
N
N
 
G
Q
 
D
F
 
Y
M
 
R
V
 
V
I
 
N
E
 
E
H
 
H
F
 
F
D
 
D
T
 
S
H
 
Q
W
 
W
H
 
N
P
 
P
L
 
I
L
 
R
G
 
D
Y
 
Y
N
 
N
E
 
K
D
 
D
N
 
N
P
 
P
A
 
A
D
 
H
G
x
R
F
|
F
R
 
R
P
 
A
Y
 
Y
G
 
G
I
 
G
T
 
T
P
 
P
G
 
G
H
 
A
G
 
W
F
 
I
E
|
E
W
 
W
A
 
G
R
 
R
L
 
L
V
 
M
L
 
L
H
 
H
L
 
L
E
 
H
A
 
A
A
 
A
R
 
-
L
 
L
Q
 
E
A
 
A
G
 
R
L
 
F
V
 
E
T
 
T
P
 
P
-
 
P
E
 
A
W
 
W
L
 
L
V
 
L
A
 
E
D
 
D
A
 
A
K
 
K
R
 
G
L
 
L
F
 
F
A
 
H
S
 
A
A
 
T
C
 
I
E
 
R
Y
 
D
A
 
A
W
 
W
S
 
A
V
 
P
D
 
D
G
 
G
A
 
A
P
 
D
G
 
G
I
 
F
V
 
V
Y
 
Y
T
 
S
L
 
V
D
 
D
W
 
W
N
 
D
H
 
G
R
 
K
P
 
P
V
 
I
V
 
V
R
 
R
E
 
E
R
 
R
L
 
V
H
 
R
W
|
W
T
 
P
H
 
I
A
 
V
E
 
E
A
 
A
S
 
M
A
 
G
A
 
T
A
 
A
Q
 
Y
A
 
A
L
 
L
L
 
Y
K
 
T
R
 
L
T
 
T
G
 
D
E
 
D
L
 
S
H
 
Q
Y
 
Y
E
 
E
T
 
E
W
 
W
Y
 
Y
R
 
Q
R
 
K
F
 
W
W
 
W
E
 
D
F
 
Y
C
 
C
E
 
I
T
 
K
H
 
Y
F
 
L
I
 
M
D
 
D
R
 
Y
L
 
E
H
 
N
G
 
G
S
 
S
W
 
W
H
 
W
H
 
Q
E
 
E
L
 
L
S
 
D
P
 
A
H
 
D
N
 
N
Q
 
K
P
 
V
S
 
T
S
 
T
N
 
K
I
 
V
W
 
W
G
 
D
G
 
G
K
 
K
P
 
Q
D
|
D
L
 
I
Y
 
Y
H
|
H
A
 
L
W
 
L
Q
 
H
A
 
C
V
 
L
L
 
V
L
 
I
P
 
P
A
 
R
L
 
L
P
 
P
L
 
L
A
 
A
P
 
P
S
 
G
M
 
L
A
 
A
S
 
P
A
 
A
I
 
V
G
 
A
T
 
A
G
 
G

2zblA Functional annotation of salmonella enterica yihs-encoded protein (see paper)
45% identity, 96% coverage: 10:413/419 of query aligns to 2:406/416 of 2zblA

query
sites
2zblA
S
 
K
W
 
W
L
 
F
N
 
N
A
 
T
P
 
L
A
 
S
H
 
H
Y
 
N
V
 
R
W
 
W
L
 
L
A
 
E
A
 
Q
E
 
E
G
 
T
Q
 
D
R
 
R
L
 
I
L
 
F
A
 
N
F
 
F
A
 
G
K
 
K
A
 
N
S
 
A
R
 
V
L
 
V
P
 
P
D
 
T
G
 
G
F
 
F
G
 
G
N
 
W
L
 
L
D
 
G
D
 
N
K
 
K
G
 
G
Q
 
Q
L
 
I
P
 
K
A
 
E
D
 
E
A
 
M
H
 
G
A
 
T
E
 
H
T
 
L
M
 
W
N
 
I
T
 
T
A
 
A
R
|
R
M
 
M
T
 
L
H
 
H
S
 
V
F
 
Y
A
 
S
M
 
V
A
 
A
H
 
A
A
 
S
L
 
M
G
 
G
L
 
R
P
 
P
G
 
G
Y
 
A
A
 
Y
E
 
D
L
 
L
V
 
V
A
 
D
H
 
H
G
 
G
V
 
I
A
 
K
A
 
A
L
 
M
S
 
N
G
 
G
A
 
A
L
 
L
R
 
R
D
 
D
S
 
K
E
 
K
H
 
Y
G
 
G
G
 
G
W
 
W
F
 
Y
A
 
A
A
 
C
P
 
V
H
 
N
-
 
D
-
 
Q
-
 
G
A
 
V
L
 
V
D
 
D
G
 
A
N
 
S
R
 
-
G
 
-
K
 
K
A
 
Q
A
 
G
Y
|
Y
L
 
Q
H
 
H
A
 
F
F
 
F
V
 
A
A
 
L
L
 
L
A
 
G
A
 
A
S
 
A
S
 
S
A
 
A
V
 
V
V
 
T
A
 
T
G
 
G
A
 
H
P
 
P
G
 
E
A
 
A
S
 
R
T
 
K
L
 
L
L
 
L
N
 
D
D
 
Y
A
 
T
I
 
I
H
 
E
I
 
V
I
 
I
D
 
E
H
 
K
F
 
Y
F
 
F
W
 
W
S
 
S
E
 
E
E
 
E
E
 
E
G
 
Q
V
 
M
M
 
C
L
 
L
E
 
E
S
 
S
F
 
W
A
 
D
Q
 
E
D
 
A
W
 
F
S
 
S
G
 
Q
V
 
T
E
 
E
A
 
D
Y
 
Y
R
 
R
G
 
G
A
 
G
N
|
N
S
 
A
N
 
N
M
 
M
H
|
H
A
 
A
T
 
V
E
 
E
A
 
A
F
 
F
L
 
L
A
 
I
L
 
V
A
 
Y
D
 
D
V
 
V
T
 
T
G
 
H
D
 
D
T
 
K
R
 
K
W
 
W
L
 
L
D
 
D
R
 
R
A
 
A
L
 
L
R
 
R
I
 
I
V
 
A
E
 
S
R
 
V
V
 
I
I
 
I
H
 
H
T
 
D
H
 
V
A
 
A
A
 
R
G
 
N
N
 
G
Q
 
D
F
 
Y
M
 
R
V
 
V
I
 
N
E
 
E
H
 
H
F
 
F
D
 
D
T
 
S
H
 
Q
W
 
W
H
 
N
P
 
P
L
 
I
L
 
R
G
 
D
Y
 
Y
N
 
N
E
 
K
D
 
D
N
 
N
P
 
P
A
 
A
D
 
H
G
 
R
F
|
F
R
 
R
P
 
A
Y
 
Y
G
 
G
I
 
G
T
 
T
P
 
P
G
 
G
H
 
A
G
 
W
F
 
I
E
|
E
W
 
W
A
 
G
R
 
R
L
 
L
V
 
M
L
 
L
H
 
H
L
 
L
E
 
H
A
 
A
A
 
A
R
 
-
L
 
L
Q
 
E
A
 
A
G
 
R
L
 
F
V
 
E
T
 
T
P
 
P
-
 
P
E
 
A
W
 
W
L
 
L
V
 
L
A
 
E
D
 
D
A
 
A
K
 
K
R
 
G
L
 
L
F
 
F
A
 
H
S
 
A
A
 
T
C
 
I
E
 
R
Y
 
D
A
 
A
W
 
W
S
 
A
V
 
P
D
 
D
G
 
G
A
 
A
P
 
D
G
 
G
I
 
F
V
 
V
Y
 
Y
T
 
S
L
 
V
D
 
D
W
 
W
N
 
D
H
 
G
R
 
K
P
 
P
V
 
I
V
 
V
R
 
R
E
 
E
R
 
R
L
 
V
H
 
R
W
|
W
T
 
P
H
 
I
A
 
V
E
 
E
A
 
A
S
 
M
A
 
G
A
 
T
A
 
A
Q
 
Y
A
 
A
L
 
L
L
 
Y
K
 
T
R
 
L
T
 
T
G
 
D
E
 
D
L
 
S
H
 
Q
Y
 
Y
E
 
E
T
 
E
W
 
W
Y
 
Y
R
 
Q
R
 
K
F
 
W
W
 
W
E
 
D
F
 
Y
C
 
C
E
 
I
T
 
K
H
 
Y
F
 
L
I
 
M
D
 
D
R
 
Y
L
 
E
H
 
N
G
 
G
S
 
S
W
 
W
H
 
W
H
 
Q
E
 
E
L
 
L
S
 
D
P
 
A
H
 
D
N
 
N
Q
 
K
P
 
V
S
 
T
S
 
T
N
 
K
I
 
V
W
 
W
G
 
D
G
 
G
K
 
K
P
 
Q
D
 
D
L
 
I
Y
 
Y
H
|
H
A
 
L
W
 
L
Q
 
H
A
 
C
V
 
L
L
 
V
L
 
I
P
 
P
A
 
R
L
 
L
P
 
P
L
 
L
A
 
A
P
 
P
S
 
G
M
 
L
A
 
A
S
 
P
A
 
A
I
 
V
G
 
A
T
 
A
G
 
G

8h1lB Crystal structure of glucose-2-epimerase in complex with d-glucitol from runella slithyformis runsl_4512 (see paper)
25% identity, 54% coverage: 39:265/419 of query aligns to 42:283/423 of 8h1lB

query
sites
8h1lB
D
 
D
G
 
Q
F
 
F
G
 
G
N
 
N
L
 
-
D
 
-
D
 
D
K
 
S
G
 
G
Q
 
E
L
 
D
P
 
E
A
 
K
D
 
S
A
 
L
H
 
I
A
 
A
E
 
Q
T
 
-
M
 
-
N
 
-
T
 
-
A
 
S
R
|
R
M
 
S
T
 
V
H
 
F
S
 
T
F
 
Y
A
 
S
M
 
S
A
 
A
H
 
H
A
 
R
L
 
A
G
 
G
L
 
Y
P
 
G
G
 
G
-
 
G
-
 
V
Y
 
L
A
 
A
E
 
E
L
 
M
V
 
A
A
 
R
H
 
H
G
 
G
V
 
V
A
 
D
A
 
Y
L
 
L
S
 
I
G
 
N
A
 
N
L
 
M
R
 
W
D
 
D
S
 
N
E
 
E
H
 
H
G
 
G
G
 
G
-
 
F
-
 
Y
W
 
W
F
 
M
A
 
T
A
 
N
P
 
R
H
 
K
A
 
G
L
 
E
D
 
V
G
 
T
N
 
I
R
 
D
G
 
Q
K
 
K
A
 
I
A
 
V
Y
|
Y
L
 
G
H
 
L
A
 
S
F
 
F
V
 
C
A
 
I
L
 
Y
A
 
S
A
 
L
S
 
S
S
 
E
A
 
Y
V
 
T
V
 
L
A
 
A
-
 
T
G
 
G
A
 
D
P
 
P
G
 
R
A
 
G
S
 
R
T
 
E
L
 
Y
L
 
A
N
 
E
D
 
K
A
 
T
I
 
F
H
 
D
I
 
L
I
 
L
D
 
Q
H
 
K
F
 
Y
F
 
A
W
 
V
S
 
D
E
 
T
E
 
H
E
 
Y
G
 
G
V
 
G
M
 
Y
L
 
F
E
 
E
S
 
M
F
 
F
A
 
N
Q
 
R
D
 
D
W
 
W
S
 
T
-
 
L
-
 
K
G
 
G
V
 
P
E
 
G
A
 
A
Y
 
A
R
 
G
G
 
G
A
 
D
N
 
R
S
 
K
N
 
T
-
 
L
-
x
D
-
 
V
-
 
H
M
 
M
H
|
H
A
 
L
T
 
M
E
 
E
A
 
A
F
 
Y
L
 
T
A
 
T
L
 
L
A
 
Y
D
 
E
V
 
C
T
 
T
G
 
G
D
 
Q
T
 
E
R
 
I
W
 
H
L
 
R
D
 
R
R
 
K
A
 
L
L
 
L
R
 
E
I
 
T
V
 
I
E
 
E
R
 
L
V
 
L
I
 
V
H
 
N
T
 
K
H
 
V
A
 
M
A
 
H
G
 
P
N
 
E
Q
 
Y
F
 
G
M
 
T
V
 
G
I
 
I
E
 
P
H
 
Q
F
 
F
D
 
W
T
 
A
H
 
D
W
 
W
H
 
S
-
 
V
-
 
A
P
 
P
L
 
Q
L
 
I
G
 
K
Y
 
F
N
 
D
E
 
I
D
 
V
N
 
W
P
 
G
A
 
W
D
 
D
G
 
R
F
 
F
R
 
N
P
 
P
Y
 
D
G
 
G
I
 
L
T
 
K
P
 
S
-
 
A
-
 
A
-
 
E
-
 
D
-
 
N
-
 
T
-
 
S
-
 
Y
G
 
G
H
|
H
G
 
N
F
 
S
E
|
E
W
 
F
A
 
A
R
 
W
L
 
L
V
 
L
L
 
M
H
 
H

Sites not aligning to the query:

Query Sequence

>GFF4325 FitnessBrowser__WCS417:GFF4325
MITQPLPASSWLNAPAHYVWLAAEGQRLLAFAKASRLPDGFGNLDDKGQLPADAHAETMN
TARMTHSFAMAHALGLPGYAELVAHGVAALSGALRDSEHGGWFAAPHALDGNRGKAAYLH
AFVALAASSAVVAGAPGASTLLNDAIHIIDHFFWSEEEGVMLESFAQDWSGVEAYRGANS
NMHATEAFLALADVTGDTRWLDRALRIVERVIHTHAAGNQFMVIEHFDTHWHPLLGYNED
NPADGFRPYGITPGHGFEWARLVLHLEAARLQAGLVTPEWLVADAKRLFASACEYAWSVD
GAPGIVYTLDWNHRPVVRERLHWTHAEASAAAQALLKRTGELHYETWYRRFWEFCETHFI
DRLHGSWHHELSPHNQPSSNIWGGKPDLYHAWQAVLLPALPLAPSMASAIGTGRYVTNW

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory