In Silico

Text mining

A considerable amount of medical expert knowledge can be found in different types of natural language text, e.g. in scientific articles, research reports. Hence the utilization of these sources can provide rather important extra information to a research system.

Hence the tasks of text mining are the following.
(1) Building a corpus (collection of literature) about a given research domain.
(2) Processing individual pieces of text, i.e. the exploration and storing of the occurrences of relevant concepts.
(3) The statistical analysis of the data constructed during the above steps, and discovery of relations and associations among domain concepts.

After the examination of textual information has successfully been done, the provided result can be exploited in several further ways.
(1) The resulting domain model can provide important pieces of information on its own right: since it basically describes the relations of the concepts as they can be extracted from the domain literature, it can give a view on the current trends and conceptions.
(2) Since the modeled concepts can be identified with the entities of the “real” model, the results can be used as a starting parameterization of a following learning phase, hence it allows for a normative integration of literature-generated associations into the results of standard examinations.
(3) Comparing the results of standard and literature-based examination can discover how the results of current examinations are related to already documented trends, theories: what they have in common and what possibly new aspects have been explored.

Detailed methodology

(1) Building the corpus.
Elements of the corpus can originate from several sources, such can be:
• Research articles and their abstracts
• Concept definitions
• Medical records and reports

The collection and definition of the set of relevant concepts also belongs to this step, as well as providing further supplementary information (like different forms and synonyms), from what it can be determined whether a given concept occurs in a piece of text or not.

(2) Calculation of occurrence measures and relevance.
Based on the number of concepts occurring in a piece of text and on the number of text pieces in which a concept occurs, for every concept-text pair a score can be calculated, describing how relevant is the given concept in the given text (cf. the tf-idf score).
The resulting relevance table can be used as the main input data of a purely statistical analysis.

(2a) Shallow parsing.
Since the above method, which is purely based on concept occurrences, cannot take into account the inter-textual relations of concepts (e.g. how they are mentioned within a sentence), the grammatical processing of texts.
Such an analysis can directly provide estimations for the associations within concept-concept pairs, hence the results of this can be used in the model-level examination of concept relations.

(2b) Deep parsing
(2c) Manual text annotation

(3) Model-level analysis.
The data provided by the previous steps are now suitable for a model-level Bayesian statistical analysis. This can provide detailed information about the relevance relations of domain concepts, which (beyond that it can be valuable on its own concerning the examined domain) can be utilized for the supporting of a further analysis based on real-world measurement data.

Database (default)	0.033664 s
28.0156 kB
Benchmark	Min	Max	Average	Total
SHOW FULL COLUMNS FROM `languages` (1)	0.002159 s	0.002159 s	0.002159 s	0.002159 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `language`.* FROM `languages` AS `language` WHERE `url` = '' LIMIT 1 (1)	0.000851 s	0.000851 s	0.000851 s	0.000851 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `language`.* FROM `languages` AS `language` WHERE `id` = 1 LIMIT 1 (1)	0.000740 s	0.000740 s	0.000740 s	0.000740 s
0.7891 kB	0.7891 kB	0.7891 kB	0.7891 kB
SHOW FULL COLUMNS FROM `urls` (1)	0.001704 s	0.001704 s	0.001704 s	0.001704 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `url`.* FROM `urls` AS `url` (1)	0.000659 s	0.000659 s	0.000659 s	0.000659 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT * FROM `languages` (1)	0.000446 s	0.000446 s	0.000446 s	0.000446 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT * FROM `language_values` (1)	0.002916 s	0.002916 s	0.002916 s	0.002916 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SHOW FULL COLUMNS FROM `menu` (1)	0.002047 s	0.002047 s	0.002047 s	0.002047 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `menu`.* FROM `menu` AS `menu` JOIN `urls` ON (`urls`.`menu_id` = `menu`.`id`) JOIN `language_values` ON (`language_values`.`word_id` = `urls`.`route`) WHERE `language_values`.`value` = 'in_silico/text_mining' AND `language_values`.`language_id` = '1' LIMIT 1 (8)	0.000431 s	0.001088 s	0.000582 s	0.004658 s
0.6641 kB	0.6641 kB	0.6641 kB	5.3125 kB
SELECT `url`.* FROM `urls` AS `url` WHERE `route_name` = 'route_78' LIMIT 1 (1)	0.000859 s	0.000859 s	0.000859 s	0.000859 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SHOW FULL COLUMNS FROM `skeletons` (1)	0.001252 s	0.001252 s	0.001252 s	0.001252 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `skeleton`.* FROM `skeletons` AS `skeleton` WHERE `skeleton`.`id` = '2' LIMIT 1 (1)	0.000649 s	0.000649 s	0.000649 s	0.000649 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `portlets`.`name`, `url_portlets`.`id`, `url_portlets`.`container_id` FROM `url_portlets` JOIN `portlets` ON (`url_portlets`.`portlet_id` = `portlets`.`id`) WHERE `url_portlets`.`url_id` = '78' AND `url_portlets`.`container_id` IN ('1', '2', '3', '4', '5', '6') ORDER BY `url_portlets`.`ord` ASC (1)	0.000953 s	0.000953 s	0.000953 s	0.000953 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SHOW FULL COLUMNS FROM `url_portlets` (1)	0.001224 s	0.001224 s	0.001224 s	0.001224 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '504' LIMIT 1 (1)	0.000654 s	0.000654 s	0.000654 s	0.000654 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '502' LIMIT 1 (1)	0.000767 s	0.000767 s	0.000767 s	0.000767 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `menu`.* FROM `menu` AS `menu` JOIN `language_values` AS `ormlv0` ON (`ormlv0`.`word_id` = `menu`.`hidden`) WHERE `ormlv0`.`language_id` = '1' AND `ormlv0`.`value` = 0 AND `parent_id` = 0 ORDER BY `ord` ASC (1)	0.000645 s	0.000645 s	0.000645 s	0.000645 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `menu`.* FROM `menu` AS `menu` JOIN `language_values` AS `ormlv0` ON (`ormlv0`.`word_id` = `menu`.`hidden`) WHERE `ormlv0`.`language_id` = '1' AND `ormlv0`.`value` = '0' AND `parent_id` = '48' (1)	0.000574 s	0.000574 s	0.000574 s	0.000574 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `menu`.* FROM `menu` AS `menu` JOIN `language_values` AS `ormlv0` ON (`ormlv0`.`word_id` = `menu`.`hidden`) WHERE `ormlv0`.`language_id` = '1' AND `ormlv0`.`value` = '0' AND `parent_id` = '74' (1)	0.000513 s	0.000513 s	0.000513 s	0.000513 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `menu`.* FROM `menu` AS `menu` WHERE `menu`.`id` = '90' LIMIT 1 (5)	0.000429 s	0.000749 s	0.000547 s	0.002735 s
0.6641 kB	0.6641 kB	0.6641 kB	3.3203 kB
SELECT `menu`.* FROM `menu` AS `menu` JOIN `language_values` AS `ormlv0` ON (`ormlv0`.`word_id` = `menu`.`hidden`) WHERE `ormlv0`.`language_id` = '1' AND `ormlv0`.`value` = '0' AND `parent_id` = '90' (1)	0.000563 s	0.000563 s	0.000563 s	0.000563 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `menu`.* FROM `menu` AS `menu` JOIN `language_values` AS `ormlv0` ON (`ormlv0`.`word_id` = `menu`.`hidden`) WHERE `ormlv0`.`language_id` = '1' AND `ormlv0`.`value` = '0' AND `parent_id` = '91' (1)	0.000433 s	0.000433 s	0.000433 s	0.000433 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `menu`.* FROM `menu` AS `menu` JOIN `language_values` AS `ormlv0` ON (`ormlv0`.`word_id` = `menu`.`hidden`) WHERE `ormlv0`.`language_id` = '1' AND `ormlv0`.`value` = '0' AND `parent_id` = '92' (1)	0.000444 s	0.000444 s	0.000444 s	0.000444 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '506' LIMIT 1 (1)	0.000651 s	0.000651 s	0.000651 s	0.000651 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '501' LIMIT 1 (1)	0.000681 s	0.000681 s	0.000681 s	0.000681 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '503' LIMIT 1 (1)	0.000713 s	0.000713 s	0.000713 s	0.000713 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `menu`.* FROM `menu` AS `menu` JOIN `language_values` AS `ormlv0` ON (`ormlv0`.`word_id` = `menu`.`hidden`) WHERE `ormlv0`.`language_id` = '1' AND `ormlv0`.`value` = '0' AND `parent_id` = 0 ORDER BY `ord` ASC (1)	0.000573 s	0.000573 s	0.000573 s	0.000573 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `menu`.* FROM `menu` AS `menu` WHERE `menu`.`parent_id` = '90' (1)	0.000698 s	0.000698 s	0.000698 s	0.000698 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '505' LIMIT 1 (1)	0.000754 s	0.000754 s	0.000754 s	0.000754 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `url_id` FROM `url_portlets` WHERE `id` = '505' (1)	0.000626 s	0.000626 s	0.000626 s	0.000626 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB
SELECT `menu_id` FROM `urls` WHERE `id` = '78' (1)	0.000524 s	0.000524 s	0.000524 s	0.000524 s
0.6641 kB	0.6641 kB	0.6641 kB	0.6641 kB

Database (default)

0.033664 s

28.0156 kB

Benchmark

Min

Max

Average

Total

SHOW FULL COLUMNS FROM `languages` (1)

0.002159 s

0.6641 kB

SELECT `language`.* FROM `languages` AS `language` WHERE `url` = '' LIMIT 1 (1)

0.000851 s

0.6641 kB

SELECT `language`.* FROM `languages` AS `language` WHERE `id` = 1 LIMIT 1 (1)

0.000740 s

0.7891 kB

SHOW FULL COLUMNS FROM `urls` (1)

0.001704 s

0.6641 kB

SELECT `url`.* FROM `urls` AS `url` (1)

0.000659 s

0.6641 kB

SELECT * FROM `languages` (1)

0.000446 s

0.6641 kB

SELECT * FROM `language_values` (1)

0.002916 s

0.6641 kB

SHOW FULL COLUMNS FROM `menu` (1)

0.002047 s

0.6641 kB

SELECT `menu`.* FROM `menu` AS `menu` JOIN `urls` ON (`urls`.`menu_id` = `menu`.`id`) JOIN `language_values` ON (`language_values`.`word_id` = `urls`.`route`) WHERE `language_values`.`value` = 'in_silico/text_mining' AND `language_values`.`language_id` = '1' LIMIT 1 (8)

0.000431 s

0.001088 s

0.000582 s

0.004658 s

0.6641 kB

5.3125 kB

SELECT `url`.* FROM `urls` AS `url` WHERE `route_name` = 'route_78' LIMIT 1 (1)

0.000859 s

0.6641 kB

SHOW FULL COLUMNS FROM `skeletons` (1)

0.001252 s

0.6641 kB

SELECT `skeleton`.* FROM `skeletons` AS `skeleton` WHERE `skeleton`.`id` = '2' LIMIT 1 (1)

0.000649 s

0.6641 kB

SELECT `portlets`.`name`, `url_portlets`.`id`, `url_portlets`.`container_id` FROM `url_portlets` JOIN `portlets` ON (`url_portlets`.`portlet_id` = `portlets`.`id`) WHERE `url_portlets`.`url_id` = '78' AND `url_portlets`.`container_id` IN ('1', '2', '3', '4', '5', '6') ORDER BY `url_portlets`.`ord` ASC (1)

0.000953 s

0.6641 kB

SHOW FULL COLUMNS FROM `url_portlets` (1)

0.001224 s

0.6641 kB

SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '504' LIMIT 1 (1)

0.000654 s

0.6641 kB

SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '502' LIMIT 1 (1)

0.000767 s

0.6641 kB

SELECT `menu`.* FROM `menu` AS `menu` JOIN `language_values` AS `ormlv0` ON (`ormlv0`.`word_id` = `menu`.`hidden`) WHERE `ormlv0`.`language_id` = '1' AND `ormlv0`.`value` = 0 AND `parent_id` = 0 ORDER BY `ord` ASC (1)

0.000645 s

0.6641 kB

0.000574 s

0.6641 kB

0.000513 s

0.6641 kB

SELECT `menu`.* FROM `menu` AS `menu` WHERE `menu`.`id` = '90' LIMIT 1 (5)

0.000429 s

0.000749 s

0.000547 s

0.002735 s

0.6641 kB

3.3203 kB

0.000563 s

0.6641 kB

0.000433 s

0.6641 kB

0.000444 s

0.6641 kB

SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '506' LIMIT 1 (1)

0.000651 s

0.6641 kB

SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '501' LIMIT 1 (1)

0.000681 s

0.6641 kB

SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '503' LIMIT 1 (1)

0.000713 s

0.6641 kB

0.000573 s

0.6641 kB

SELECT `menu`.* FROM `menu` AS `menu` WHERE `menu`.`parent_id` = '90' (1)

0.000698 s

0.6641 kB

SELECT `urlportlet`.* FROM `url_portlets` AS `urlportlet` WHERE `urlportlet`.`id` = '505' LIMIT 1 (1)

0.000754 s

0.6641 kB

SELECT `url_id` FROM `url_portlets` WHERE `id` = '505' (1)

0.000626 s

0.6641 kB

SELECT `menu_id` FROM `urls` WHERE `id` = '78' (1)

0.000524 s

0.6641 kB

Kohana	0.007019 s
54.2813 kB
Benchmark	Min	Max	Average	Total
find_file (77)	0.000027 s	0.000290 s	0.000091 s	0.007019 s
0.5078 kB	2.1328 kB	0.7050 kB	54.2813 kB

Kohana

0.007019 s

54.2813 kB

Benchmark

Min

Max

Average

Total

find_file (77)

0.000027 s

0.000290 s

0.000091 s

0.007019 s

0.5078 kB

2.1328 kB

0.7050 kB

54.2813 kB

Requests	0.132625 s
1,935.5859 kB
Benchmark	Min	Max	Average	Total
"in_silico/text_mining" (1)	0.092514 s	0.092514 s	0.092514 s	0.092514 s
1,458.1797 kB	1,458.1797 kB	1,458.1797 kB	1,458.1797 kB
"en/portlet/content" « "in_silico/text_mining" (1)	0.007024 s	0.007024 s	0.007024 s	0.007024 s
238.2188 kB	238.2188 kB	238.2188 kB	238.2188 kB
"en/portlet/menu" « "in_silico/text_mining" (1)	0.012259 s	0.012259 s	0.012259 s	0.012259 s
59.6484 kB	59.6484 kB	59.6484 kB	59.6484 kB
"en/portlet/footer" « "in_silico/text_mining" (1)	0.001852 s	0.001852 s	0.001852 s	0.001852 s
20.5156 kB	20.5156 kB	20.5156 kB	20.5156 kB
"en/portlet/contentheader" « "in_silico/text_mining" (1)	0.003940 s	0.003940 s	0.003940 s	0.003940 s
45.9688 kB	45.9688 kB	45.9688 kB	45.9688 kB
"en/portlet/contentmenu" « "in_silico/text_mining" (1)	0.011663 s	0.011663 s	0.011663 s	0.011663 s
56.6797 kB	56.6797 kB	56.6797 kB	56.6797 kB
"en/portlet/contentimage" « "in_silico/text_mining" (1)	0.005609 s	0.005609 s	0.005609 s	0.005609 s
54.6563 kB	54.6563 kB	54.6563 kB	54.6563 kB

Requests

0.132625 s

1,935.5859 kB

Benchmark

Min

Max

Average

Total

"in_silico/text_mining" (1)

0.092514 s

1,458.1797 kB

"en/portlet/content" « "in_silico/text_mining" (1)

0.007024 s

238.2188 kB

"en/portlet/menu" « "in_silico/text_mining" (1)

0.012259 s

59.6484 kB

"en/portlet/footer" « "in_silico/text_mining" (1)

0.001852 s

20.5156 kB

"en/portlet/contentheader" « "in_silico/text_mining" (1)

0.003940 s

45.9688 kB

"en/portlet/contentmenu" « "in_silico/text_mining" (1)

0.011663 s

56.6797 kB

"en/portlet/contentimage" « "in_silico/text_mining" (1)

0.005609 s

54.6563 kB

Application Execution (257)	0.083565 s	0.615440 s	0.191945 s	0.170079 s
4,653.4688 kB	5,250.6641 kB	4,744.0029 kB	4,714.2813 kB

Application Execution (257)

0.083565 s

0.615440 s

0.191945 s

0.170079 s

4,653.4688 kB

5,250.6641 kB

4,744.0029 kB

4,714.2813 kB