SCOPUS 정보 검색 플랫폼

EMNLP 2016 - Conference on Empirical Methods in Natural Language Processing, Proceedings

Volumn , Issue , 2016, Pages 1955-1960

Analyzing the behavior of visual question answering models

(3) Agrawal, Aishwarya a Batra, Dhruv a,b Parikh, Devi a,b

a VIRGINIA POLYTECHNIC INSTITUTE AND STATE UNIVERSITY (United States)

b GEORGIA INSTITUTE OF TECHNOLOGY (United States)

Author keywords

[No Author keywords available]

Indexed keywords

DEEP LEARNING;

BEHAVIOR ANALYSIS; LEARNING BASED MODELS; QUESTION ANSWERING; RECENT PROGRESS; SYSTEMATIC METHOD;

NATURAL LANGUAGE PROCESSING SYSTEMS;

EID: 85072842417 PISSN: None EISSN: None Source Type: Conference Proceeding
DOI: 10.18653/v1/d16-1203 Document Type: Conference Paper

Times cited : (273)

References (26)

1
- 84985013144
- Deep compositional question answering with neural module networks
- 1
- Jacob Andreas, Marcus Rohrbach, Trevor Darrell, and Dan Klein. 2016a. Deep compositional question answering with neural module networks. In CVPR. 1
- (2016) CVPR
- Andreas, J.¹ Rohrbach, M.² Darrell, T.³ Klein, D.⁴

2
- 84993660571
- Learning to compose neural networks for question answering
- 1
- Jacob Andreas, Marcus Rohrbach, Trevor Darrell, and Dan Klein. 2016b. Learning to compose neural networks for question answering. In NAACL. 1
- (2016) NAACL
- Andreas, J.¹ Rohrbach, M.² Darrell, T.³ Klein, D.⁴

3
- 84973890960
- VQA: Visual question answering
- 1, 2
- Stanislaw Antol, Aishwarya Agrawal, Jiasen Lu, Margaret Mitchell, Dhruv Batra, C. Lawrence Zitnick, and Devi Parikh. 2015. Vqa: Visual question answering. In ICCV. 1, 2
- (2015) ICCV
- Antol, S.¹ Agrawal, A.² Lu, J.³ Mitchell, M.⁴ Batra, D.⁵ Lawrence Zitnick, C.⁶ Parikh, D.⁷

4
- 84986262382
- CoRR, abs/1511.05960. 1
- Kan Chen, Jiang Wang, Liang-Chieh Chen, Haoyuan Gao, Wei Xu, and Ram Nevatia. 2015. ABC-CNN: an attention based convolutional neural network for visual question answering. CoRR, abs/1511.05960. 1
- (2015) ABC-CNN: An Attention Based Convolutional Neural Network for Visual Question Answering
- Chen, K.¹ Wang, J.² Chen, L.-C.³ Gao, H.⁴ Xu, W.⁵ Nevatia, R.⁶

5
- 85044506279
- Multimodal compact bilinear pooling for visual question answering and visual grounding
- 1, 2
- Akira Fukui, Dong Huk Park, Daylen Yang, Anna Rohrbach, Trevor Darrell, and Marcus Rohrbach. 2016. Multimodal compact bilinear pooling for visual question answering and visual grounding. In EMNLP. 1, 2
- (2016) EMNLP
- Fukui, A.¹ Park, D.H.² Yang, D.³ Rohrbach, A.⁴ Darrell, T.⁵ Rohrbach, M.⁶

6
- 84973873525
- A visual turing test for computer vision systems
- 1
- Donald Geman, Stuart Geman, Neil Hallonquist, and Laurent Younes. 2014. A Visual Turing Test for Computer Vision Systems. In PNAS. 1
- (2014) PNAS
- Geman, D.¹ Geman, S.² Hallonquist, N.³ Younes, L.⁴

7
- 84887374674
- Diagnosing error in object detectors
- 2
- Derek Hoiem, Yodsawalai Chodpathumwan, and Qieyun Dai. 2012. Diagnosing error in object detectors. In ECCV. 2
- (2012) ECCV
- Hoiem, D.¹ Chodpathumwan, Y.² Dai, Q.³

8
- 85018925213
- CoRR, abs/1604.01485. 1
- Ilija Ilievski, Shuicheng Yan, and Jiashi Feng. 2016. A focused dynamic attention model for visual question answering. CoRR, abs/1604.01485. 1
- (2016) A Focused Dynamic Attention Model for Visual Question Answering
- Ilievski, I.¹ Yan, S.² Feng, J.³

9
- 85037344457
- CoRR, abs/1511.05676. 1
- Aiwen Jiang, Fang Wang, Fatih Porikli, and Yi Li. 2015. Compositional memory for visual question answering. CoRR, abs/1511.05676. 1
- (2015) Compositional Memory for Visual Question Answering
- Jiang, A.¹ Wang, F.² Porikli, F.³ Li, Y.⁴

10
- 84986300506
- Answer-type prediction for visual question answering
- 1
- Kushal Kafle and Christopher Kanan. 2016. Answer-type prediction for visual question answering. In CVPR. 1
- (2016) CVPR
- Kafle, K.¹ Kanan, C.²

11
- 84959876313
- Visualizing and understanding recurrent networks
- 1
- Andrej Karpathy, Justin Johnson, and Fei-Fei Li. 2016. Visualizing and understanding recurrent networks. In ICLR Workshop. 1
- (2016) ICLR Workshop
- Karpathy, A.¹ Johnson, J.² Li, F.-F.³

12
- 85018868398
- Multimodal residual learning for visual QA
- 1
- Jin-Hwa Kim, Sang-Woo Lee, Dong-Hyun Kwak, Min-Oh Heo, Jeonghee Kim, Jung-Woo Ha, and Byoung-Tak Zhang. 2016. Multimodal residual learning for visual QA. In NIPS. 1
- (2016) NIPS
- Kim, J.-H.¹ Lee, S.-W.² Kwak, D.-H.³ Heo, M.-O.⁴ Kim, J.⁵ Ha, J.-W.⁶ Zhang, B.-T.⁷

13
- 85018930392
- Jiasen Lu, Xiao Lin, Dhruv Batra, and Devi Parikh. 2015. Deeper lstm and normalized cnn visual question answering model. https://github.com/VT-vision-lab/ VQA_LSTM_CNN. 1, 2
- (2015) Deeper Lstm and Normalized Cnn Visual Question Answering Model
- Lu, J.¹ Lin, X.² Batra, D.³ Parikh, D.⁴

14
- 85018917850
- Hierarchical question-image co-attention for visual question answering
- 1, 2
- Jiasen Lu, Jianwei Yang, Dhruv Batra, and Devi Parikh. 2016. Hierarchical question-image co-attention for visual question answering. In NIPS. 1, 2
- (2016) NIPS
- Lu, J.¹ Yang, J.² Batra, D.³ Parikh, D.⁴

15
- 84937822746
- A Multi-World Approach to Question Answering about Real-World Scenes based on Uncertain Input
- 1
- Mateusz Malinowski and Mario Fritz. 2014. A Multi-World Approach to Question Answering about Real-World Scenes based on Uncertain Input. In NIPS. 1
- (2014) NIPS
- Malinowski, M.¹ Fritz, M.²

16
- 85083951332
- Efficient estimation of word representations in vector space
- 3
- Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean. 2013. Efficient estimation of word representations in vector space. In ICLR. 3
- (2013) ICLR
- Mikolov, T.¹ Chen, K.² Corrado, G.³ Dean, J.⁴

17
- 85030462424
- CoRR, abs/1606.03647. 1
- Hyeonwoo Noh and Bohyung Han. 2016. Training recurrent answering units with joint loss minimization for vqa. CoRR, abs/1606.03647. 1
- (2016) Training Recurrent Answering Units with Joint Loss Minimization for Vqa
- Noh, H.¹ Han, B.²

18
- 85031713628
- CoRR, abs/1606.06108. 1
- Kuniaki Saito, Andrew Shin, Yoshitaka Ushiku, and Tatsuya Harada. 2016. Dualnet: Domain-invariant network for visual question answering. CoRR, abs/1606.06108. 1
- (2016) Dualnet: Domain-Invariant Network for Visual Question Answering
- Saito, K.¹ Shin, A.² Ushiku, Y.³ Harada, T.⁴

19
- 84986327457
- Where to look: Focus regions for visual question answering
- 1
- Kevin J. Shih, Saurabh Singh, and Derek Hoiem. 2016. Where to look: Focus regions for visual question answering. In CVPR. 1
- (2016) CVPR
- Shih, K.J.¹ Singh, S.² Hoiem, D.³

20
- 84998721476
- CoRR, abs/1511.02570. 1
- Peng Wang, Qi Wu, Chunhua Shen, Anton van den Hengel, and Anthony R. Dick. 2015. Explicit knowledge-based reasoning for visual question answering. CoRR, abs/1511.02570. 1
- (2015) Explicit Knowledge-Based Reasoning for Visual Question Answering
- Wang, P.¹ Wu, Q.² Shen, C.³ Van Den Hengel, A.⁴ Dick, A.R.⁵

21
- 84986320870
- Ask me Anything: Free-form visual question answering based on knowledge from external sources
- 1
- Qi Wu, Peng Wang, Chunhua Shen, Anton van den Hengel, and Anthony R. Dick. 2016. Ask me anything: Free-form visual question answering based on knowledge from external sources. In CVPR. 1
- (2016) CVPR
- Wu, Q.¹ Wang, P.² Shen, C.³ Van Den Hengel, A.⁴ Dick, A.R.⁵

22
- 84999008900
- Dynamic memory networks for visual and textual question answering
- 1
- Caiming Xiong, Stephen Merity, and Richard Socher. 2016. Dynamic memory networks for visual and textual question answering. In ICML. 1
- (2016) ICML
- Xiong, C.¹ Merity, S.² Socher, R.³

23
- 85035008367
- Ask, attend and answer: Exploring question-guided spatial attention for visual question answering
- 1
- Huijuan Xu and Kate Saenko. 2016. Ask, attend and answer: Exploring question-guided spatial attention for visual question answering. In ECCV. 1
- (2016) ECCV
- Xu, H.¹ Saenko, K.²

24
- 84986334021
- Stacked attention networks for image question answering
- 1, 2
- Zichao Yang, Xiaodong He, Jianfeng Gao, Li Deng, and Alexander J. Smola. 2016. Stacked attention networks for image question answering. In CVPR. 1, 2
- (2016) CVPR
- Yang, Z.¹ He, X.² Gao, J.³ Deng, L.⁴ Smola, A.J.⁵

25
- 84986278354
- Yin and Yang: Balancing and answering binary visual questions
- 5
- Peng Zhang, Yash Goyal, Douglas Summers-Stay, Dhruv Batra, and Devi Parikh. 2016. Yin and Yang: Balancing and answering binary visual questions. In CVPR. 5
- (2016) CVPR
- Zhang, P.¹ Goyal, Y.² Summers-Stay, D.³ Batra, D.⁴ Parikh, D.⁵

26
- 84986301525
- CoRR, abs/1512.02167. 1
- Bolei Zhou, Yuandong Tian, Sainbayar Sukhbaatar, Arthur Szlam, and Rob Fergus. 2015. Simple baseline for visual question answering. CoRR, abs/1512.02167. 1
- (2015) Simple Baseline for Visual Question Answering
- Zhou, B.¹ Tian, Y.² Sukhbaatar, S.³ Szlam, A.⁴ Fergus, R.⁵

* 이 정보는 Elsevier사의 SCOPUS DB에서 KISTI가 분석하여 추출한 것입니다.