SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_053939150.1 NCBI__GCF_001294205.1:WP_053939150.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 10 hits to proteins with known functional sites (download)

1e19A Structure of the carbamate kinase-like carbamoyl phosphate synthetase from the hyperthermophilic archaeon pyrococcus furiosus bound to adp (see paper)
48% identity, 89% coverage: 4:286/319 of query aligns to 2:285/313 of 1e19A

query
sites
1e19A
R
 
K
L
 
R
A
 
V
V
 
V
V
 
I
A
 
A
V
 
L
G
 
G
G
|
G
N
|
N
A
 
A
L
 
L
I
 
Q
R
 
Q
D
 
R
D
 
G
Q
 
Q
H
 
K
T
 
G
S
 
S
I
 
Y
P
 
E
D
 
E
Q
 
M
Y
 
M
E
 
D
A
 
N
V
 
V
I
 
R
E
 
K
S
 
T
V
 
A
S
 
R
H
 
Q
I
 
I
V
 
A
P
 
E
L
 
I
I
 
I
E
 
A
A
 
R
G
 
G
W
 
Y
N
 
E
V
 
V
V
 
V
L
 
I
T
 
T
H
 
H
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
F
 
S
I
 
L
L
 
L
R
 
L
R
 
H
S
 
M
E
 
D
L
 
A
-
 
G
-
 
Q
A
 
A
A
 
T
L
 
Y
E
 
G
V
 
I
A
 
P
P
 
A
V
 
Q
P
 
P
L
 
M
D
 
D
Y
 
V
A
 
A
V
 
G
G
 
A
D
 
M
T
 
S
Q
 
Q
G
 
G
A
 
W
I
 
I
G
 
G
Y
 
Y
M
 
M
F
 
I
Q
 
Q
K
 
Q
A
 
A
L
 
L
T
 
K
N
 
N
E
 
E
L
 
L
Q
 
R
R
 
K
R
 
R
G
 
G
L
 
M
I
 
E
K
 
K
P
 
K
V
 
V
I
 
V
T
 
T
L
 
I
V
 
I
T
 
T
Q
 
Q
T
 
T
R
 
I
V
 
V
S
 
D
L
 
K
S
 
N
D
 
D
P
 
P
A
 
A
F
 
F
R
 
Q
N
 
N
P
 
P
A
 
T
K
|
K
P
 
P
V
 
V
G
 
G
A
 
P
F
 
F
L
 
Y
D
 
D
E
 
E
D
 
E
T
 
T
A
 
A
R
 
K
I
 
R
R
 
L
Q
 
A
R
 
R
E
 
E
L
 
K
G
 
G
W
 
W
T
 
I
V
 
V
M
 
K
E
 
E
D
 
D
A
 
S
G
 
G
R
 
R
G
 
G
W
 
W
R
 
R
R
 
R
T
 
V
V
 
V
A
 
P
S
 
S
P
 
P
Q
 
D
P
 
P
Q
 
K
E
 
G
I
 
H
L
 
V
E
 
E
S
 
A
G
 
E
L
 
T
I
 
I
G
 
K
Q
 
K
L
 
L
V
 
V
E
 
E
Q
 
R
G
 
G
C
 
V
V
 
I
V
 
V
I
 
I
A
 
A
C
 
S
G
 
G
G
 
G
G
 
G
G
 
G
I
 
V
P
 
P
V
 
V
V
 
I
R
 
L
D
 
-
E
 
E
H
 
D
Q
 
G
Q
 
E
L
 
I
Q
 
K
G
 
G
V
 
V
E
 
E
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
A
 
A
S
 
G
A
 
E
L
 
K
L
 
L
A
 
A
T
 
E
Q
 
E
L
 
V
G
 
N
A
 
A
D
 
D
L
 
I
L
 
F
L
 
M
I
 
I
P
 
L
T
|
T
G
x
D
V
|
V
E
 
N
Q
 
G
V
 
A
A
|
A
I
 
L
N
 
Y
F
x
Y
G
 
G
K
 
T
P
 
E
D
 
K
Q
 
E
Q
 
Q
W
 
W
L
 
L
N
 
R
Q
 
E
L
 
V
S
 
K
L
 
V
E
 
E
E
 
E
A
 
L
Q
 
R
A
 
K
L
 
Y
I
 
Y
E
 
E
Q
 
E
G
 
G
Q
 
H
F
 
F
G
x
K
A
 
A
G
 
G
S
|
S
M
|
M
L
 
G
P
 
P
K
|
K
V
 
V
E
 
L
A
 
A
I
 
A
L
 
I
G
 
R
F
 
F
V
 
I
E
 
E

2we5A Carbamate kinase from enterococcus faecalis bound to mgadp (see paper)
47% identity, 88% coverage: 7:286/319 of query aligns to 5:279/309 of 2we5A

query
sites
2we5A
V
 
V
V
 
V
A
 
A
V
 
L
G
|
G
G
|
G
N
|
N
A
 
A
L
 
I
I
 
L
R
 
S
D
 
N
D
 
D
Q
 
-
H
 
-
T
 
A
S
 
S
I
 
A
P
 
H
D
 
A
Q
 
Q
Y
 
Q
E
 
Q
A
 
A
V
 
L
I
 
V
E
 
Q
S
 
T
V
 
S
S
 
A
H
 
Y
I
 
L
V
 
V
P
 
H
L
 
L
I
 
I
E
 
K
A
 
Q
G
 
G
W
 
H
N
 
R
V
 
L
V
 
I
L
 
V
T
 
S
H
 
H
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
F
 
N
I
 
L
L
 
L
R
 
L
R
 
Q
S
 
Q
E
 
Q
L
 
A
A
 
A
A
 
D
L
 
S
E
 
E
V
 
K
A
 
N
P
 
P
-
 
A
V
 
M
P
 
P
L
 
L
D
 
D
Y
 
T
A
 
C
V
 
V
G
 
A
D
 
M
T
 
T
Q
 
Q
G
 
G
A
 
S
I
 
I
G
 
G
Y
 
Y
M
 
W
F
 
L
Q
 
S
K
 
N
A
 
A
L
 
L
T
 
N
N
 
Q
E
 
E
L
 
L
Q
 
N
R
 
K
R
 
A
G
 
G
L
 
I
I
 
K
K
 
K
P
 
Q
V
 
V
I
 
A
T
 
T
L
 
V
V
 
L
T
 
T
Q
 
Q
T
 
V
R
 
V
V
 
V
S
 
D
L
 
P
S
 
A
D
 
D
P
 
E
A
 
A
F
 
F
R
 
K
N
 
N
P
 
P
A
 
T
K
|
K
P
 
P
V
 
I
G
 
G
A
 
P
F
 
F
L
 
L
D
 
T
E
 
E
D
 
A
T
 
E
A
 
A
R
 
K
I
 
-
R
 
E
Q
 
A
R
 
M
E
 
Q
L
 
A
G
 
G
W
 
A
T
 
I
V
 
F
M
 
K
E
 
E
D
 
D
A
 
A
G
 
G
R
 
R
G
 
G
W
 
W
R
 
R
R
 
K
T
 
V
V
 
V
A
 
P
S
 
S
P
 
P
Q
 
K
P
 
P
Q
 
I
E
 
D
I
 
I
L
 
H
E
 
E
S
 
A
G
 
E
L
 
T
I
 
I
G
 
N
Q
 
T
L
 
L
V
 
I
E
 
K
Q
 
N
G
 
D
C
 
I
V
 
I
V
 
T
I
 
I
A
 
S
C
 
C
G
 
G
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
V
V
 
V
R
 
G
D
 
-
E
 
-
H
 
-
Q
 
Q
Q
 
E
L
 
L
Q
 
K
G
 
G
V
 
V
E
 
E
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
F
A
 
A
S
 
S
A
 
E
L
 
K
L
 
L
A
 
A
T
 
E
Q
 
L
L
 
V
G
 
D
A
 
A
D
 
D
L
 
A
L
 
L
L
 
V
I
 
I
P
 
L
T
|
T
G
|
G
V
|
V
E
 
D
Q
 
Y
V
|
V
A
x
C
I
 
I
N
 
N
F
x
Y
G
 
G
K
 
K
P
 
P
D
 
D
Q
 
E
Q
 
K
W
 
Q
L
 
L
N
 
T
Q
 
N
L
 
V
S
 
T
L
 
V
E
 
A
E
 
E
A
 
L
Q
 
E
A
 
E
L
 
Y
I
 
K
E
 
Q
Q
 
A
G
 
G
Q
 
H
F
 
F
G
x
A
A
 
P
G
 
G
S
|
S
M
|
M
L
 
L
P
 
P
K
|
K
V
 
I
E
 
E
A
 
A
I
 
A
L
 
I
G
 
Q
F
 
F
V
 
V
E
 
E

2we4A Carbamate kinase from enterococcus faecalis bound to a sulfate ion and two water molecules, which mimic the substrate carbamyl phosphate (see paper)
47% identity, 88% coverage: 7:286/319 of query aligns to 5:279/309 of 2we4A

query
sites
2we4A
V
 
V
V
 
V
A
 
A
V
 
L
G
|
G
G
|
G
N
|
N
A
 
A
L
 
I
I
 
L
R
 
S
D
 
N
D
 
D
Q
 
-
H
 
-
T
 
A
S
 
S
I
 
A
P
 
H
D
 
A
Q
 
Q
Y
 
Q
E
 
Q
A
 
A
V
 
L
I
 
V
E
 
Q
S
 
T
V
 
S
S
 
A
H
 
Y
I
 
L
V
 
V
P
 
H
L
 
L
I
 
I
E
 
K
A
 
Q
G
 
G
W
 
H
N
x
R
V
 
L
V
 
I
L
 
V
T
 
S
H
 
H
G
|
G
N
 
N
G
|
G
P
 
P
Q
 
Q
V
 
V
G
 
G
F
 
N
I
 
L
L
 
L
R
 
L
R
 
Q
S
 
Q
E
 
Q
L
 
A
A
 
A
A
 
D
L
 
S
E
 
E
V
 
K
A
 
N
P
 
P
-
 
A
V
 
M
P
 
P
L
 
L
D
 
D
Y
 
T
A
 
C
V
 
V
G
 
A
D
 
M
T
 
T
Q
 
Q
G
 
G
A
 
S
I
 
I
G
 
G
Y
 
Y
M
 
W
F
 
L
Q
 
S
K
 
N
A
 
A
L
 
L
T
 
N
N
 
Q
E
 
E
L
 
L
Q
 
N
R
 
K
R
 
A
G
 
G
L
 
I
I
 
K
K
 
K
P
 
Q
V
 
V
I
 
A
T
 
T
L
 
V
V
 
L
T
 
T
Q
 
Q
T
 
V
R
 
V
V
 
V
S
 
D
L
 
P
S
 
A
D
 
D
P
 
E
A
 
A
F
 
F
R
 
K
N
 
N
P
 
P
A
 
T
K
|
K
P
 
P
V
 
I
G
 
G
A
 
P
F
 
F
L
 
L
D
 
T
E
 
E
D
 
A
T
 
E
A
 
A
R
 
K
I
 
-
R
 
E
Q
 
A
R
 
M
E
 
Q
L
 
A
G
 
G
W
 
A
T
 
I
V
 
F
M
 
K
E
 
E
D
 
D
A
 
A
G
 
G
R
 
R
G
 
G
W
 
W
R
 
R
R
 
K
T
 
V
V
 
V
A
 
P
S
 
S
P
 
P
Q
 
K
P
 
P
Q
 
I
E
 
D
I
 
I
L
 
H
E
 
E
S
 
A
G
 
E
L
 
T
I
 
I
G
 
N
Q
 
T
L
 
L
V
 
I
E
 
K
Q
 
N
G
 
D
C
 
I
V
 
I
V
 
T
I
 
I
A
 
S
C
 
C
G
 
G
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
V
V
 
V
R
 
G
D
 
-
E
 
-
H
 
-
Q
 
Q
Q
 
E
L
 
L
Q
 
K
G
 
G
V
 
V
E
 
E
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
F
A
 
A
S
 
S
A
 
E
L
 
K
L
 
L
A
 
A
T
 
E
Q
 
L
L
 
V
G
 
D
A
 
A
D
 
D
L
 
A
L
 
L
L
 
V
I
 
I
P
 
L
T
 
T
G
 
G
V
 
V
E
 
D
Q
 
Y
V
 
V
A
 
C
I
|
I
N
|
N
F
 
Y
G
 
G
K
 
K
P
 
P
D
 
D
Q
 
E
Q
 
K
W
 
Q
L
 
L
N
 
T
Q
 
N
L
 
V
S
 
T
L
 
V
E
 
A
E
 
E
A
 
L
Q
 
E
A
 
E
L
 
Y
I
 
K
E
 
Q
Q
 
A
G
 
G
Q
x
H
F
|
F
G
 
A
A
 
P
G
 
G
S
 
S
M
 
M
L
 
L
P
 
P
K
|
K
V
 
I
E
 
E
A
 
A
I
 
A
L
 
I
G
 
Q
F
 
F
V
 
V
E
 
E

Sites not aligning to the query:

P0A2X8 Carbamate kinase 1; EC 2.7.2.2 from Enterococcus faecium (Streptococcus faecium) (see 2 papers)
47% identity, 88% coverage: 7:286/319 of query aligns to 6:280/310 of P0A2X8

query
sites
P0A2X8
V
 
V
V
 
V
A
 
A
V
 
L
G
 
G
G
 
G
N
 
N
A
 
A
L
 
I
I
 
L
R
 
S
D
 
N
D
 
D
Q
 
-
H
 
-
T
 
A
S
 
S
I
 
A
P
 
H
D
 
A
Q
 
Q
Y
 
Q
E
 
Q
A
 
A
V
 
L
I
 
V
E
 
Q
S
 
T
V
 
S
S
 
A
H
 
Y
I
 
L
V
 
V
P
 
H
L
 
L
I
 
I
E
 
K
A
 
Q
G
 
G
W
 
H
N
 
R
V
 
L
V
 
I
L
 
V
T
 
S
H
 
H
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
F
 
N
I
 
L
L
 
L
R
 
L
R
 
Q
S
 
Q
E
 
Q
L
 
A
A
 
A
A
 
D
L
 
S
E
 
E
V
 
K
A
 
N
P
 
P
-
 
A
V
 
M
P
 
P
L
 
L
D
 
D
Y
 
T
A
 
C
V
 
V
G
 
A
D
 
M
T
 
T
Q
 
Q
G
 
G
A
 
S
I
 
I
G
 
G
Y
 
Y
M
 
W
F
 
L
Q
 
S
K
 
N
A
 
A
L
 
L
T
 
N
N
 
Q
E
 
E
L
 
L
Q
 
N
R
 
K
R
 
A
G
 
G
L
 
I
I
 
K
K
 
K
P
 
Q
V
 
V
I
 
A
T
 
T
L
 
V
V
 
L
T
 
T
Q
 
Q
T
 
V
R
 
V
V
 
V
S
 
D
L
 
P
S
 
A
D
 
D
P
 
E
A
 
A
F
 
F
R
 
K
N
 
N
P
 
P
A
 
T
K
 
K
P
 
P
V
 
I
G
 
G
A
 
P
F
 
F
L
 
L
D
 
T
E
|
E
D
 
A
T
x
E
A
 
A
R
x
K
I
 
-
R
x
E
Q
 
A
R
 
M
E
 
Q
L
 
A
G
 
G
W
 
A
T
 
I
V
 
F
M
 
K
E
 
E
D
 
D
A
 
A
G
 
G
R
 
R
G
 
G
W
 
W
R
 
R
R
 
K
T
 
V
V
 
V
A
 
P
S
 
S
P
 
P
Q
 
K
P
 
P
Q
 
I
E
 
D
I
 
I
L
 
H
E
 
E
S
 
A
G
 
E
L
 
T
I
 
I
G
 
N
Q
 
T
L
 
L
V
 
I
E
 
K
Q
 
N
G
 
D
C
 
I
V
 
I
V
 
T
I
 
I
A
 
S
C
 
C
G
 
G
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
V
V
 
V
R
 
G
D
 
-
E
 
-
H
 
-
Q
 
Q
Q
 
E
L
 
L
Q
 
K
G
 
G
V
 
V
E
 
E
A
 
A
V
 
V
I
 
I
D
|
D
K
 
K
D
|
D
L
 
F
A
 
A
S
 
S
A
 
E
L
 
K
L
 
L
A
 
A
T
 
E
Q
 
L
L
 
V
G
 
D
A
 
A
D
 
D
L
 
A
L
 
L
L
 
V
I
 
I
P
 
L
T
 
T
G
 
G
V
 
V
E
 
D
Q
 
Y
V
 
V
A
 
C
I
 
I
N
 
N
F
 
Y
G
 
G
K
 
K
P
 
P
D
 
D
Q
 
E
Q
 
K
W
 
Q
L
 
L
N
 
T
Q
 
N
L
 
V
S
 
T
L
 
V
E
 
A
E
 
E
A
 
L
Q
 
E
A
 
E
L
 
Y
I
 
K
E
 
Q
Q
 
A
G
 
G
Q
 
H
F
 
F
G
 
A
A
 
P
G
 
G
S
 
S
M
 
M
L
 
L
P
 
P
K
 
K
V
 
I
E
 
E
A
 
A
I
 
A
L
 
I
G
 
Q
F
 
F
V
 
V
E
 
E

Sites not aligning to the query:

4jz8A Carbamate kinase from giardia lamblia bound to citric acid (see paper)
42% identity, 98% coverage: 4:317/319 of query aligns to 5:313/316 of 4jz8A

query
sites
4jz8A
R
 
K
L
 
T
A
 
V
V
 
V
V
 
I
A
 
A
V
 
L
G
|
G
G
|
G
N
|
N
A
 
A
L
 
M
I
 
L
R
 
Q
D
 
A
D
 
K
Q
 
E
H
 
K
T
 
G
S
 
D
I
 
Y
P
 
D
D
 
T
Q
 
Q
Y
 
R
E
 
K
A
 
N
V
 
V
I
 
E
E
 
I
S
 
A
V
 
A
S
 
S
H
 
E
I
 
I
V
 
Y
P
 
K
L
 
I
I
 
H
E
 
K
A
 
A
G
 
G
W
 
Y
N
 
K
V
 
V
V
 
V
L
 
L
T
 
T
H
 
S
G
|
G
N
 
N
G
|
G
P
|
P
Q
 
Q
V
 
V
G
 
G
F
 
A
I
 
I
L
 
K
R
 
L
R
 
Q
S
 
N
E
 
Q
L
 
A
A
 
A
A
 
A
L
 
G
E
 
V
V
 
S
A
 
P
P
 
E
V
 
M
P
 
P
L
 
L
D
 
H
Y
 
V
A
 
C
V
 
G
G
 
A
D
 
M
T
 
S
Q
 
Q
G
 
G
A
 
F
I
 
I
G
 
G
Y
 
Y
M
 
M
F
 
M
Q
 
S
K
 
Q
A
 
A
L
 
M
T
 
D
N
 
N
E
 
V
L
 
F
Q
 
C
R
 
A
R
 
N
G
 
N
L
 
E
I
 
P
K
 
A
P
 
N
V
 
C
I
 
V
T
 
T
L
 
C
V
 
V
T
 
T
Q
 
Q
T
 
T
R
 
L
V
 
V
S
 
D
L
 
P
S
 
K
D
 
D
P
 
Q
A
 
A
F
 
F
R
 
T
N
 
N
P
 
P
A
 
T
K
|
K
P
 
P
V
 
V
G
 
G
A
 
R
F
 
F
L
 
Y
D
 
T
E
 
E
D
 
Q
T
 
E
A
 
A
R
 
K
-
 
D
I
 
L
R
 
M
Q
 
A
R
 
A
E
 
N
L
 
P
G
 
G
W
 
K
T
 
I
V
 
L
M
 
R
E
 
E
D
 
D
A
 
A
G
 
G
R
 
R
G
 
G
W
 
W
R
 
R
R
 
V
T
 
V
V
 
V
A
 
P
S
 
S
P
 
P
Q
 
R
P
 
P
Q
 
L
E
 
E
I
 
I
L
 
V
E
 
E
S
 
Y
G
 
G
L
 
V
I
 
I
G
 
K
Q
 
T
L
 
L
V
 
I
E
 
D
Q
 
N
G
 
N
C
 
V
V
 
L
V
 
V
I
 
I
A
 
C
C
 
T
G
 
N
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
C
V
 
K
R
 
R
D
 
-
E
 
E
H
 
N
Q
 
K
Q
 
V
L
 
I
Q
 
S
G
 
G
V
 
V
E
 
D
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
A
 
A
S
 
T
A
 
S
L
 
L
L
 
L
A
 
A
T
 
K
Q
 
T
L
 
L
G
 
N
A
 
S
D
 
D
L
 
Y
L
 
L
L
 
M
I
 
I
P
 
L
T
 
T
G
 
D
V
 
V
E
 
L
Q
 
N
V
 
A
A
 
C
I
 
I
N
 
N
F
 
Y
G
 
K
K
 
K
P
 
P
D
 
D
Q
 
E
Q
 
R
W
 
K
L
 
L
N
 
E
Q
 
E
L
 
I
S
 
K
L
 
L
E
 
S
E
 
E
A
 
I
Q
 
L
A
 
A
L
 
L
I
 
E
E
 
K
Q
 
D
G
 
G
Q
 
H
F
 
F
G
 
A
A
 
A
G
 
G
S
 
S
M
 
M
L
 
G
P
 
P
K
|
K
V
 
V
E
 
R
A
 
A
I
 
A
L
 
I
G
 
E
F
 
F
V
 
T
E
 
Q
Q
 
A
S
 
T
R
 
-
Q
 
-
Q
 
-
G
 
G
K
 
K
A
 
M
A
 
S
S
 
-
G
 
-
L
 
I
I
 
I
T
 
T
S
 
S
P
 
L
A
 
S
A
 
T
I
 
A
G
 
V
R
 
D
A
 
A
L
 
L
S
 
N
R
 
G
E
 
K
T
 
C
G
 
G
T
 
T
W
 
R
I
 
I

4jz7C Carbamate kinase from giardia lamblia bound to amp-pnp (see paper)
42% identity, 98% coverage: 4:317/319 of query aligns to 5:313/316 of 4jz7C

query
sites
4jz7C
R
 
K
L
 
T
A
 
V
V
 
V
V
 
I
A
 
A
V
 
L
G
 
G
G
|
G
N
|
N
A
 
A
L
 
M
I
 
L
R
 
Q
D
 
A
D
 
K
Q
 
E
H
 
K
T
 
G
S
 
D
I
 
Y
P
 
D
D
 
T
Q
 
Q
Y
 
R
E
 
K
A
 
N
V
 
V
I
 
E
E
 
I
S
 
A
V
 
A
S
 
S
H
 
E
I
 
I
V
 
Y
P
 
K
L
 
I
I
 
H
E
 
K
A
 
A
G
 
G
W
 
Y
N
 
K
V
 
V
V
 
V
L
 
L
T
 
T
H
 
S
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
F
 
A
I
 
I
L
 
K
R
 
L
R
 
Q
S
 
N
E
 
Q
L
 
A
A
 
A
A
 
A
L
 
G
E
 
V
V
 
S
A
 
P
P
 
E
V
 
M
P
 
P
L
 
L
D
 
H
Y
 
V
A
 
C
V
 
G
G
 
A
D
 
M
T
 
S
Q
 
Q
G
 
G
A
 
F
I
 
I
G
 
G
Y
 
Y
M
 
M
F
 
M
Q
 
S
K
 
Q
A
 
A
L
 
M
T
 
D
N
 
N
E
 
V
L
 
F
Q
 
C
R
 
A
R
 
N
G
 
N
L
 
E
I
 
P
K
 
A
P
 
N
V
 
C
I
 
V
T
 
T
L
 
C
V
 
V
T
 
T
Q
 
Q
T
 
T
R
 
L
V
 
V
S
 
D
L
 
P
S
 
K
D
 
D
P
 
Q
A
 
A
F
 
F
R
 
T
N
 
N
P
 
P
A
 
T
K
|
K
P
 
P
V
 
V
G
 
G
A
 
R
F
 
F
L
 
Y
D
 
T
E
 
E
D
 
Q
T
 
E
A
 
A
R
 
K
-
 
D
I
 
L
R
 
M
Q
 
A
R
 
A
E
 
N
L
 
P
G
 
G
W
 
K
T
 
I
V
 
L
M
 
R
E
 
E
D
 
D
A
 
A
G
 
G
R
 
R
G
 
G
W
 
W
R
 
R
R
 
V
T
 
V
V
 
V
A
 
P
S
 
S
P
 
P
Q
 
R
P
 
P
Q
 
L
E
 
E
I
 
I
L
 
V
E
 
E
S
 
Y
G
 
G
L
 
V
I
 
I
G
 
K
Q
 
T
L
 
L
V
 
I
E
 
D
Q
 
N
G
 
N
C
 
V
V
 
L
V
 
V
I
 
I
A
 
C
C
 
T
G
 
N
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
C
V
 
K
R
 
R
D
 
-
E
 
E
H
 
N
Q
 
K
Q
 
V
L
 
I
Q
 
S
G
 
G
V
 
V
E
 
D
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
A
 
A
S
 
T
A
 
S
L
 
L
L
 
L
A
 
A
T
 
K
Q
 
T
L
 
L
G
 
N
A
 
S
D
 
D
L
 
Y
L
 
L
L
 
M
I
 
I
P
 
L
T
|
T
G
x
D
V
 
V
E
 
L
Q
 
N
V
 
A
A
x
C
I
 
I
N
 
N
F
x
Y
G
 
K
K
 
K
P
 
P
D
 
D
Q
 
E
Q
 
R
W
 
K
L
 
L
N
 
E
Q
 
E
L
 
I
S
 
K
L
 
L
E
 
S
E
 
E
A
 
I
Q
 
L
A
 
A
L
 
L
I
 
E
E
 
K
Q
 
D
G
 
G
Q
 
H
F
 
F
G
 
A
A
 
A
G
 
G
S
|
S
M
|
M
L
 
G
P
 
P
K
|
K
V
 
V
E
 
R
A
 
A
I
 
A
L
 
I
G
 
E
F
 
F
V
 
T
E
 
Q
Q
 
A
S
 
T
R
 
-
Q
 
-
Q
 
-
G
 
G
K
 
K
A
 
M
A
 
S
S
 
-
G
 
-
L
 
I
I
 
I
T
 
T
S
 
S
P
 
L
A
 
S
A
 
T
I
 
A
G
 
V
R
 
D
A
 
A
L
 
L
S
 
N
R
 
G
E
 
K
T
 
C
G
 
G
T
 
T
W
 
R
I
 
I

4olcA Carbamate kinase from giardia lamblia thiocarbamoylated by disulfiram on cys242 (see paper)
41% identity, 98% coverage: 4:317/319 of query aligns to 4:305/308 of 4olcA

query
sites
4olcA
R
 
K
L
 
T
A
 
V
V
 
V
V
 
I
A
 
A
V
 
L
G
 
G
G
|
G
N
|
N
A
 
A
L
 
M
I
 
L
R
 
Q
D
 
A
D
 
K
Q
 
E
H
 
K
T
 
G
S
 
D
I
 
Y
P
 
D
D
 
T
Q
 
Q
Y
 
R
E
 
K
A
 
N
V
 
V
I
 
E
E
 
I
S
 
A
V
 
A
S
 
S
H
 
E
I
 
I
V
 
Y
P
 
K
L
 
I
I
 
H
E
 
K
A
 
A
G
 
G
W
 
Y
N
 
K
V
 
V
V
 
V
L
 
L
T
 
T
H
 
S
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
F
 
A
I
 
I
L
 
K
R
 
L
R
 
Q
S
 
N
E
 
Q
L
 
A
A
 
A
A
 
A
L
 
G
E
 
V
V
 
S
A
 
P
P
 
E
V
 
M
P
 
P
L
 
L
D
 
H
Y
 
V
A
 
C
V
 
G
G
 
A
D
 
M
T
 
S
Q
 
Q
G
 
G
A
 
F
I
 
I
G
 
G
Y
 
Y
M
 
M
F
 
M
Q
 
S
K
 
Q
A
 
A
L
 
M
T
 
D
N
 
N
E
 
V
L
 
F
Q
 
C
R
 
A
R
 
N
G
 
N
L
 
E
I
 
P
K
 
A
P
 
N
V
 
C
I
 
V
T
 
T
L
 
C
V
 
V
T
 
T
Q
 
Q
T
 
T
R
 
L
V
 
V
S
 
D
L
 
P
S
 
K
D
 
D
P
 
Q
A
 
A
F
 
F
R
 
T
N
 
N
P
 
P
A
 
T
K
|
K
P
 
P
V
 
V
G
 
G
A
 
R
F
 
F
L
 
Y
D
 
T
E
 
E
D
 
Q
T
 
E
A
 
A
R
 
K
-
 
D
I
 
L
R
 
M
Q
 
A
R
 
A
E
 
N
L
 
P
G
 
G
W
 
K
T
 
I
V
 
L
M
 
R
E
 
E
D
 
D
A
 
A
G
 
G
R
 
R
G
 
G
W
 
W
R
 
R
R
 
V
T
 
V
V
 
V
A
 
P
S
 
S
P
 
P
Q
 
R
P
 
P
Q
 
L
E
 
E
I
 
I
L
 
V
E
 
E
S
 
Y
G
 
G
L
 
V
I
 
I
G
 
K
Q
 
T
L
 
L
V
 
I
E
 
D
Q
 
N
G
 
N
C
 
V
V
 
L
V
 
V
I
 
I
A
 
C
C
 
T
G
 
N
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
C
V
 
K
R
 
R
D
 
-
E
 
E
H
 
N
Q
 
K
Q
 
V
L
 
I
Q
 
S
G
 
G
V
 
V
E
 
D
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
A
 
A
S
 
T
A
 
S
L
 
L
L
 
L
A
 
A
T
 
K
Q
 
T
L
 
L
G
 
N
A
 
S
D
 
D
L
 
Y
L
 
L
L
 
M
I
 
I
P
 
L
T
 
T
G
x
D
V
 
V
E
x
L
Q
 
N
V
 
A
A
 
C
I
 
I
N
 
-
F
 
-
G
 
-
K
 
-
P
 
-
D
 
-
Q
 
-
Q
 
R
W
 
K
L
 
L
N
 
E
Q
 
E
L
 
I
S
 
K
L
 
L
E
 
S
E
 
E
A
 
I
Q
 
L
A
 
A
L
 
L
I
 
E
E
 
K
Q
 
D
G
 
G
Q
 
H
F
 
F
G
 
A
A
 
A
G
 
G
S
 
S
M
 
M
L
 
G
P
 
P
K
|
K
V
 
V
E
 
R
A
 
A
I
 
A
L
 
I
G
 
E
F
 
F
V
 
T
E
 
Q
Q
 
A
S
 
T
R
 
-
Q
 
-
Q
 
-
G
 
G
K
 
K
A
 
M
A
 
S
S
 
-
G
 
-
L
 
I
I
 
I
T
 
T
S
 
S
P
 
L
A
x
S
A
 
T
I
 
A
G
 
V
R
 
D
A
 
A
L
 
L
S
 
N
R
 
G
E
 
K
T
 
C
G
 
G
T
 
T
W
 
R
I
 
I

8crvA Crystal structure of the carbamate kinase from pseudomonas aeruginosa
42% identity, 91% coverage: 7:295/319 of query aligns to 6:282/312 of 8crvA

query
sites
8crvA
V
 
V
V
 
V
A
 
A
V
 
L
G
 
G
G
|
G
N
 
N
A
 
A
L
 
L
I
 
L
R
 
R
D
 
R
D
 
G
Q
 
E
H
 
P
T
 
M
S
 
T
I
 
A
P
 
D
D
 
N
Q
 
Q
Y
 
R
E
 
E
A
 
N
V
 
V
-
 
R
-
 
I
-
 
A
I
 
A
E
 
E
S
 
Q
V
 
I
S
 
A
H
 
K
I
 
V
V
 
A
P
 
P
L
 
-
I
 
-
E
 
-
A
 
-
G
 
G
W
 
N
N
 
E
V
 
L
V
 
V
L
 
I
T
 
A
H
 
H
G
|
G
N
|
N
G
|
G
P
 
P
Q
 
Q
V
 
V
G
 
G
F
 
L
I
 
L
L
 
A
R
 
L
R
 
Q
S
 
G
E
 
A
L
 
-
A
 
A
A
 
Y
L
 
D
E
 
K
V
 
V
A
 
S
P
 
P
V
 
Y
P
 
P
L
 
L
D
 
D
Y
 
V
A
 
L
V
 
G
G
 
A
D
 
E
T
 
T
Q
 
E
G
 
G
A
 
M
I
 
I
G
 
G
Y
 
Y
M
 
M
F
 
I
Q
 
E
K
 
Q
A
 
E
L
 
M
T
 
G
N
 
N
E
 
L
L
 
L
Q
 
P
R
 
-
R
 
-
G
 
-
L
 
F
I
 
E
K
 
V
P
 
P
V
 
F
I
 
A
T
 
T
L
 
I
V
 
L
T
 
T
Q
 
Q
T
 
V
R
 
E
V
 
V
S
 
D
L
 
G
S
 
K
D
 
D
P
 
P
A
 
A
F
 
F
R
 
Q
N
 
N
P
 
P
A
 
T
K
 
K
P
 
P
V
 
I
G
 
G
A
 
P
F
 
V
L
 
Y
D
 
S
E
 
R
D
 
E
T
 
E
A
 
A
R
 
E
I
 
R
R
 
L
Q
 
A
R
 
A
E
 
E
L
 
K
G
 
G
W
 
W
T
 
S
V
 
I
M
 
T
E
 
P
D
 
D
A
 
-
G
 
G
R
 
D
G
 
K
W
 
F
R
 
R
R
 
R
T
 
V
V
 
V
A
 
P
S
 
S
P
 
P
Q
 
R
P
 
P
Q
 
K
E
 
R
I
 
I
L
 
F
E
 
E
S
 
I
G
 
R
L
 
P
I
 
V
G
 
K
Q
 
W
L
 
L
V
 
L
E
 
E
Q
 
K
G
 
G
C
 
T
V
 
I
V
 
V
I
 
I
A
 
C
C
 
A
G
 
G
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
T
V
 
M
R
 
Y
D
 
D
E
 
E
H
 
A
-
 
G
Q
 
K
Q
 
K
L
 
L
Q
 
S
G
 
G
V
 
V
E
 
E
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
A
 
C
S
 
S
A
 
S
L
 
L
L
 
L
A
 
A
T
 
Q
Q
 
E
L
 
L
G
 
V
A
 
A
D
 
D
L
 
I
L
 
L
L
 
I
I
 
I
P
 
A
T
 
T
G
 
D
V
 
V
E
 
D
Q
 
A
V
 
A
A
 
Y
I
 
V
N
 
D
F
 
W
G
 
G
K
 
K
P
 
P
D
 
T
Q
 
Q
Q
 
K
W
 
A
L
 
I
N
 
A
Q
 
Q
L
 
A
S
 
H
L
 
P
E
 
D
E
 
E
A
 
-
Q
 
-
A
 
-
L
 
-
I
 
L
E
 
E
Q
 
R
G
 
L
Q
 
G
F
 
F
G
 
A
A
 
A
G
 
G
S
 
S
M
 
M
L
 
G
P
 
P
K
 
K
V
 
V
E
 
Q
A
 
A
I
 
A
L
 
I
G
 
E
F
 
F
V
 
-
E
 
-
Q
 
-
S
 
A
R
 
R
Q
 
A
Q
 
T
G
 
G
K
 
K
A
 
D
A
 
A

4jz7A Carbamate kinase from giardia lamblia bound to amp-pnp (see paper)
38% identity, 98% coverage: 4:317/319 of query aligns to 5:282/285 of 4jz7A

query
sites
4jz7A
R
 
K
L
 
T
A
 
V
V
 
V
V
 
I
A
 
A
V
 
L
G
|
G
G
|
G
N
|
N
A
 
A
L
 
M
I
 
L
R
 
Q
D
 
A
D
 
K
Q
 
E
H
 
K
T
 
G
S
 
D
I
 
Y
P
 
D
D
 
T
Q
 
Q
Y
 
R
E
 
K
A
 
N
V
 
V
I
 
E
E
 
I
S
 
A
V
 
A
S
 
S
H
 
E
I
 
I
V
 
Y
P
 
K
L
 
I
I
 
H
E
 
K
A
 
A
G
 
G
W
 
Y
N
 
K
V
 
V
V
 
V
L
 
L
T
 
T
H
 
S
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
F
 
A
I
 
I
L
 
K
R
 
L
R
 
Q
S
 
N
E
 
Q
L
 
A
A
 
A
A
 
A
L
 
G
E
 
V
V
 
S
A
 
P
P
 
E
V
 
M
P
 
P
L
 
L
D
 
H
Y
 
V
A
 
C
V
 
G
G
 
A
D
 
M
T
 
S
Q
 
Q
G
 
G
A
 
F
I
 
I
G
 
G
Y
 
Y
M
 
M
F
 
M
Q
 
S
K
 
Q
A
 
A
L
 
M
T
 
D
N
 
N
E
 
V
L
 
F
Q
 
C
R
 
A
R
 
N
G
 
N
L
 
E
I
 
P
K
 
A
P
 
N
V
 
C
I
 
V
T
 
T
L
 
C
V
 
V
T
 
T
Q
 
Q
T
 
T
R
 
L
V
 
V
S
 
D
L
 
P
S
 
K
D
 
D
P
 
Q
A
 
A
F
 
F
R
 
T
N
 
N
P
 
P
A
 
T
K
|
K
P
 
P
V
 
V
G
 
-
A
 
-
F
 
-
L
 
-
D
 
-
E
 
-
D
 
-
T
 
-
A
 
-
R
 
-
I
 
-
R
 
-
Q
 
-
R
 
-
E
 
-
L
 
-
G
 
-
W
 
-
T
 
-
V
 
-
M
 
-
E
 
-
D
 
-
A
 
-
G
 
-
R
 
-
G
 
-
W
 
-
R
 
-
R
 
-
T
 
V
V
 
V
A
 
P
S
 
S
P
 
P
Q
 
R
P
 
P
Q
 
L
E
 
E
I
 
I
L
 
V
E
 
E
S
 
Y
G
 
G
L
 
V
I
 
I
G
 
K
Q
 
T
L
 
L
V
 
I
E
 
D
Q
 
N
G
 
N
C
 
V
V
 
L
V
 
V
I
 
I
A
 
C
C
 
T
G
 
N
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
C
V
 
K
R
 
R
D
 
-
E
 
E
H
 
N
Q
 
K
Q
 
V
L
 
I
Q
 
S
G
 
G
V
 
V
E
 
D
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
A
 
A
S
 
T
A
 
S
L
 
L
L
 
L
A
 
A
T
 
K
Q
 
T
L
 
L
G
 
N
A
 
S
D
 
D
L
 
Y
L
 
L
L
 
M
I
 
I
P
 
L
T
|
T
G
x
D
V
 
V
E
 
L
Q
 
N
V
 
A
A
x
C
I
 
I
N
 
N
F
x
Y
G
 
K
K
 
K
P
 
P
D
 
D
Q
 
E
Q
 
R
W
 
K
L
 
L
N
 
E
Q
 
E
L
 
I
S
 
K
L
 
L
E
 
S
E
 
E
A
 
I
Q
 
L
A
 
A
L
 
L
I
 
E
E
 
K
Q
 
D
G
 
G
Q
 
H
F
 
F
G
x
A
A
 
A
G
 
G
S
|
S
M
|
M
L
 
G
P
 
P
K
|
K
V
 
V
E
 
R
A
 
A
I
 
A
L
 
I
G
 
E
F
 
F
V
 
T
E
 
Q
Q
 
A
S
 
T
R
 
-
Q
 
-
Q
 
-
G
 
G
K
 
K
A
 
M
A
 
S
S
 
-
G
 
-
L
 
I
I
 
I
T
 
T
S
 
S
P
 
L
A
 
S
A
 
T
I
 
A
G
 
V
R
 
D
A
 
A
L
 
L
S
 
N
R
 
G
E
 
K
T
 
C
G
 
G
T
 
T
W
 
R
I
 
I

4axsA Structure of carbamate kinase from mycoplasma penetrans (see paper)
37% identity, 97% coverage: 7:317/319 of query aligns to 3:289/291 of 4axsA

query
sites
4axsA
V
 
V
V
 
I
A
 
A
V
 
L
G
 
G
G
|
G
N
|
N
A
 
A
L
 
L
I
 
G
R
 
D
D
 
N
D
 
P
Q
 
S
H
 
Q
T
 
-
S
 
-
I
 
-
P
 
-
D
 
-
Q
 
Q
Y
 
K
E
 
E
A
 
L
V
 
V
I
 
K
E
 
I
S
 
P
V
 
A
S
 
A
H
 
K
I
 
I
V
 
A
P
 
A
L
 
L
I
 
I
E
 
Q
A
 
E
G
 
G
W
 
H
N
 
E
V
 
V
V
 
I
L
 
V
T
 
G
H
 
H
G
|
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
F
 
M
I
 
I
L
 
F
R
 
N
-
 
A
-
 
F
-
 
A
R
 
D
S
 
A
E
 
K
L
 
K
A
 
A
A
 
N
L
 
E
E
 
K
V
 
T
A
 
A
P
 
L
V
 
V
P
 
P
L
 
F
D
 
A
Y
 
E
A
 
A
V
 
G
G
 
G
D
 
M
T
 
S
Q
 
Q
G
 
G
A
 
Y
I
 
I
G
 
G
Y
 
Y
M
 
H
F
 
M
Q
 
L
K
 
T
A
 
A
L
 
I
T
 
S
N
 
N
E
 
E
L
 
L
Q
 
K
R
 
K
R
 
L
G
 
N
L
 
I
I
 
Q
K
 
K
P
 
D
V
 
V
I
 
L
T
 
Y
L
 
F
V
 
L
T
 
T
Q
 
Q
T
 
T
R
 
I
V
 
V
S
 
D
L
 
A
S
 
N
D
 
D
P
 
P
A
 
A
F
 
F
R
 
K
N
 
N
P
 
P
A
 
T
K
|
K
P
 
P
V
 
V
G
 
G
A
 
P
F
 
F
L
 
Y
D
 
S
E
 
N
D
 
P
T
 
N
A
 
S
R
 
V
I
 
I
R
 
V
Q
 
-
R
 
-
E
 
-
L
 
-
G
 
-
W
 
-
T
 
-
V
 
-
M
 
-
E
 
-
D
 
-
A
 
-
G
 
-
R
 
-
G
 
-
W
 
-
R
 
-
R
 
K
T
 
V
V
 
V
A
 
A
S
 
S
P
 
P
Q
 
I
P
 
P
Q
 
V
E
 
D
I
 
F
L
 
I
E
 
G
S
 
I
G
 
D
L
 
A
I
 
I
G
 
K
Q
 
Q
L
 
N
V
 
V
E
 
N
Q
 
N
G
 
G
C
 
C
V
 
V
V
 
C
I
 
I
A
 
V
C
 
G
G
 
G
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
T
V
 
I
R
 
I
D
 
Q
E
 
D
H
 
N
Q
 
Q
Q
 
Y
L
 
I
Q
 
-
G
 
G
V
 
V
E
 
D
A
 
G
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
F
A
 
A
S
 
L
A
 
A
L
 
K
L
 
I
A
 
A
T
 
D
Q
 
A
L
 
V
G
 
N
A
 
A
D
 
D
L
 
I
L
 
F
L
 
V
I
 
V
P
 
L
T
 
T
G
 
A
V
 
V
E
 
D
Q
 
Y
V
 
V
A
 
Y
I
 
V
N
 
D
F
 
F
G
 
N
K
 
K
P
 
P
D
 
T
Q
 
Q
Q
 
K
W
 
A
L
 
L
N
 
K
Q
 
T
L
 
V
S
 
D
L
 
V
E
 
K
E
 
A
A
 
L
Q
 
N
A
 
N
L
 
F
I
 
I
E
 
N
Q
 
Q
G
 
D
Q
 
Q
F
 
F
G
 
A
A
 
K
G
 
G
S
 
S
M
 
M
L
 
L
P
 
P
K
|
K
V
 
I
E
 
K
A
 
A
I
 
A
L
 
M
G
 
G
F
 
F
V
 
V
E
 
N
Q
 
G
S
 
H
R
 
P
Q
 
N
Q
 
R
G
 
-
K
 
-
A
 
-
A
 
-
S
 
S
G
 
A
L
 
I
I
 
I
T
 
A
S
 
D
P
 
L
A
 
S
A
 
K
I
 
V
G
 
E
R
 
D
A
 
A
L
 
L
S
 
K
R
 
G
E
 
L
T
 
S
G
 
G
T
 
T
W
 
K
I
 
I

Query Sequence

>WP_053939150.1 NCBI__GCF_001294205.1:WP_053939150.1
MKPRLAVVAVGGNALIRDDQHTSIPDQYEAVIESVSHIVPLIEAGWNVVLTHGNGPQVGF
ILRRSELAALEVAPVPLDYAVGDTQGAIGYMFQKALTNELQRRGLIKPVITLVTQTRVSL
SDPAFRNPAKPVGAFLDEDTARIRQRELGWTVMEDAGRGWRRTVASPQPQEILESGLIGQ
LVEQGCVVIACGGGGIPVVRDEHQQLQGVEAVIDKDLASALLATQLGADLLLIPTGVEQV
AINFGKPDQQWLNQLSLEEAQALIEQGQFGAGSMLPKVEAILGFVEQSRQQGKAASGLIT
SPAAIGRALSRETGTWINA

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory